CN102223367A - 移动用户访问网站的方法、设备及系统 - Google Patents

移动用户访问网站的方法、设备及系统 Download PDF

Info

Publication number
CN102223367A
CN102223367A CN2011101562214A CN201110156221A CN102223367A CN 102223367 A CN102223367 A CN 102223367A CN 2011101562214 A CN2011101562214 A CN 2011101562214A CN 201110156221 A CN201110156221 A CN 201110156221A CN 102223367 A CN102223367 A CN 102223367A
Authority
CN
China
Prior art keywords
website
user
voice signal
mobile device
authentication result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101562214A
Other languages
English (en)
Other versions
CN102223367B (zh
Inventor
何婷婷
胡郁
胡国平
葛勇
王智国
刘庆峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201110156221.4A priority Critical patent/CN102223367B/zh
Publication of CN102223367A publication Critical patent/CN102223367A/zh
Application granted granted Critical
Publication of CN102223367B publication Critical patent/CN102223367B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及网站访问技术领域,公开了一种移动用户访问网站的方法、设备及系统,该方法包括:接收用户访问网站的语音信号;根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。利用本发明,可以实现移动用户访问网站时的自动登录,提高访问效率。

Description

移动用户访问网站的方法、设备及系统
技术领域
本发明涉及网站访问技术领域,特别涉及一种移动用户访问网站的方法、设备及系统。
背景技术
近年来随着互联网应用日新月异的发展,网络资源日益丰富,给用户的信息获取带来了极大的便利。然而很多网站尤其是各类论坛对用户访问权限往往做了各种设定,需要用户登录并在身份验证有效后才支持特定功能的访问。个性订制模式保障了用户数据安全,然而多网站访问需要的频繁注册和登录也给用户带来了很大的不便。首先用户在网站注册时,由于各网站对用户名或密码的输入往往有不同规则限定或者用户常用的用户名被注册,导致用户不可能一直采用自己习惯的登录名,而在不同网站注册了不同的用户名。在后续网站登录时,对应不同网站需要记忆不同的注册信息,给用户信息管理带来了不便。其次用户在移动设备特别是在屏幕较小的手机等设备上输入账号密码往往不太方便。显然用户独立注册登录不同网站的方式在日益丰富的网络资源应用下显得过于复杂,访问效率低。
发明内容
本发明实施例提供一种移动用户访问网站的方法、设备及系统,以解决现有技术中移动用户访问不同网站实现复杂的问题,实现移动用户访问网站时的自动登录,提高访问效率。
一方面,本发明实施例提供一种移动用户访问网站的方法,包括:
接收用户访问网站的语音信号;
根据所述语音信号进行用户身份有效性验证以及网站名解析;
根据用户身份验证结果向解析得到的网站发送访问请求。
优选地,所述根据所述语音信号进行用户身份有效性验证包括:
从所述语音信号中提取声纹特征;
将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
优选地,所述根据所述语音信号进行网站名解析包括:
从所述语音信号中提取声学特征;
利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
根据匹配结果,确定用户请求访问的网站。
优选地,所述方法还包括:在根据所述语音信号进行用户身份有效性验证以及网站名解析之前,对所述语音信号进行降噪处理。
优选地,所述根据用户身份验证结果向解析得到的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动设备,包括:
语音信息接收单元,用于接收用户访问网站的语音信号;
身份验证单元,用于根据所述语音信号进行用户身份有效性验证;
解析单元,用于根据所述语音信号进行网站名解析;
访问单元,用于根据所述身份验证单元得到的用户身份验证结果向所述解析单元解析得到的网站发送访问请求。
优选地,所述身份验证单元包括:
声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
优选地,所述解析单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征;
语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
优选地,所述移动设备还包括:
预处理单元,用于对所述语音信息接收单元接收的语音信号进行降噪处理。
优选地,所述访问单元包括:
判断子单元,用于在所述身份验证单元的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
注册子单元,用于在所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
第一发送子单元,用于在所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
第二发送子单元,用于在所述身份验证单元的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动用户访问网站的系统,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,并将所述语音信号发送给所述服务器;
所述服务器,用于接收所述客户端发送的语音信号,并根据所述语音信号进行用户身份有效性验证以及网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
优选地,所述客户端,还用于在将所述语音信号发送给所述服务器之前,对所述语音信号进行降噪处理。
优选地,所述客户端根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
另一方面,本发明实施例还提供一种移动用户访问网站的系统,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给所述服务器;
所述服务器,用于接收所述客户端发送的所述声纹特征和声学特征,并根据所述声纹特征进行用户身份有效性验证,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
优选地,所述客户端,还用于在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。
本发明实施例移动用户访问网站的方法、设备及系统,在接收到用户访问网站的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。即无需用户通过手工方式在不同网站注册,自动实现移动用户访问网站时的自动登录,提高访问效率。
附图说明
为了更清楚地说明本发明实施的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例移动设备对网站访问的方法的流程图;
图2是本发明实施例中用户身份有效性验证的流程图;
图3是本发明实施例中网站名解析的流程图;
图4是本发明实施例移动设备的一种结构示意图;
图5是本发明实施例移动设备的另一种结构示意图;
图6是本发明实施例移动设备对网站访问的系统的一种结构示意图;
图7是本发明实施例移动设备对网站访问的系统的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于随着智能手机的普及和移动通讯技术的发展,移动设备的功能日益增强,更多地承担起私人助理的角色,用户在其上可实现众多个性化操作。为此,本发明实施例移动用户访问网站的方法、设备及系统,在接收到用户访问网站的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析;根据用户身份验证结果向解析得到的网站发送访问请求。即无需用户通过手工方式在不同网站注册,自动实现移动用户访问网站时的自动注册及登录,提高访问效率。
如图1所示,是本发明实施例移动设备对网站访问的方法的流程图,包括以下步骤:
步骤101,接收用户访问网站的语音信号。
移动设备可以跟踪用户输入,记录用户输入的语音信号。在具体应用中,为了降低语音信号识别的复杂度,可以设置一个类似导航页面的界面,记录用户在该界面下输入的语音信号。
上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
在实际应用中,可以将上述语音信号采样为一系列离散能量值存入数据缓存区。
步骤102,根据所述语音信号进行用户身份有效性验证以及网站名解析。
具体地,可以预先在移动设备中载入该移动设备注册用户的声纹模型、以及声学模型。
所述声纹模型用于模拟当前移动设备支持的使用者即注册用户的发音特点,利用上述声纹模型及语音信号进行用户身份有效性验证,判断其是否为当前用户设备的合法用户。
所述声学模型用于模拟字符发音,计算用户输入的语音信号相对于不同发音模型的相似度,进而识别用户指令内容,确定用户请求登录的网站。
用户身份有效性验证及网站名解析的具体过程将在后面详细说明。
步骤103,根据用户身份验证结果向解析得到的网站发送访问请求。
具体地,如果用户身份验证结果是所述用户是当前移动设备的合法用户,则需要进一步判断所述用户是否为首次登录所述解析得到的网站;如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求。
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
考虑到移动设备很大程度上起到用户私人助理的职责,主要供用户个人使用,因而在本发明实施例中,可以提取移动设备标识IMEI(International Mobile Equipment Identity,国际移动设备标识)作为用户名,在上述注册过程中,可以将移动设备的IMEI信息包含在上述注册请求中,发送给网站服务器,从而自动完成注册过程。由于IMEI的唯一性和不重复性,避免了用户自行设计用户名的困难,而同时其自动检测提取也极为方便,提高了效率。
当然,本发明实施例中并不限定上述作为注册用户名的具体信息,比如还可以是手机号码,IP地址等。
可见,本发明实施例移动设备对网站访问的方法,只需用户通过语音指令的方式发出网站登录请求,在移动设备对用户身份验证后自动实现登录,无需移动设备用户输入用户名及密码,避免了小屏幕设备上输入的困难及账号管理的困扰,通过对用户身份的验证实现对访问网站的自动登录,有效地提高了访问效率。
需要说明的是,考虑到上述声纹模型以及声学模型都是在无噪声“干净”的环境中采集训练得到,而当真实测试环境中存在各种噪音干扰如背景音时,解析识别的性能会有所下降。因此,为了提高系统的鲁棒性,在上述步骤101和步骤102之间还可进一步包括以下步骤:对接收的语音信号进行降噪处理。
首先通过对语音信号的短时能量和短时过零率分析,将连续的语音信号分割成独立的语音片断和非语音片断,然后对分割得到的语音片断进行语音增强处理,在进行语音增强处理时,可以通过维纳滤波等方法,将语音信号中的环境噪声进一步消除,以提高后续系统对该信号的处理能力。
相应地,在后续步骤102中,则可以利用降噪处理后的语音信号进行用户身份有效性验证以及网站名解析。
下面将对本发明实施例中对用户身份有效性验证及网站名解析的过程做详细说明。
在本发明实施例中,可以采用声纹识别技术对用户身份进行有效性验证。声纹识别是一种根据语音波形中说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性。而语音识别的目的是识别出语音信号中的言语内容,并不考虑说明人是谁,它强调的是共性。一个基本的声纹识别系统通常包括特征检测、模式匹配以及模式判断几部分。本发明实施例中用户身份有效性检测就是对用户输入的语音信号进行分析,判断其是否为当前移动设备的合法用户,即注册用户。
如图2所示,是本发明实施例中用户身份有效性验证的一种流程图,包括以下步骤:
步骤201,从输入的语音信号中提取声纹特征。
首先从输入的语音信号中提取唯一表现说话人身份的有效且稳定可靠的声纹特征,该声纹特征可以有效地区分不同的说话人,且对同一说话人声音的变化保持相对稳定。具体可以采用现有的一些声纹识别系统完成上述声纹特征的提取。目前的声纹识别系统主要依靠较低层次的声学特征进行识别,主要有谱包络参数语音特征,基音轮廓、共振峰频率带宽特征,线性预测系数,倒谱系数等。考虑到特征的可量化性、训练样本的数量和系统性能的评价等问题,可以优先选用39维MFCC(Mel Frequency Cepstrum Coefficient,Mel频率倒谱系数)特征用作语音识别和用户身份认证。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。MFCC则是利用它们之间的这种关系,计算得到的Hz频谱特征。
对提取的13维MFCC特征序列,分别计算这13维特征的一阶和二阶倒数,这样对每一语音帧都得到39维的特征矢量。
步骤202,将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度。
将提取的声纹特征记为X,将移动设备注册用户声纹模型记为U,则将声纹特征X与当前移动设备注册用户的声纹模型U进行匹配,得到对应的相似度得分为p(X|U),即上述第一相似度为p(X|U)。
步骤203,将所述声纹特征与背景声纹模型或仿冒者声纹模型进行匹配,得到第二相似度。
同样,将背景声纹模型或仿冒者声纹模型记为G,则将声纹特征X与背景声纹模型或仿冒者声纹模型G进行匹配,得到对应的相似度得分为p(X|G),即上述第二相似度为p(X|G)。
需要说明的是,上述步骤202和步骤203中模型匹配可以选用各种不同的方案,如模板匹配、动态时间规划、神经网络等等。比如可以采用语音识别领域常用的GMM(Gaussian Mixture Model,高斯混合模型)。在构建GMM模型时,为移动设备注册用户和通用模仿者分别建立单独的GMM发声模型,通过训练得到各高斯的均值、方差以及加权系数等参数。这里用户个人声纹模型是用户在初次使用上述移动设备时通过录制部分语音数据训练得到,而仿冒者声纹模型则是事先预置的通过采集大量不同发音人的语音数据提前训练得到。模型匹配时计算输入语音相对于用户声纹模型和仿冒者声纹模型相似度p(X|U)、p(X|G)。
在上述GMM声纹模型训练过程中,采用的模拟用户发音特点的GMM模型的主要参数包括高斯系数、高斯均值、方差等,具体可记为:
P ( X | U ) = Σ i = 1 M w i N ( m i , S i ) ;
其中,N(mi,si)是均值为mi,方差为si高斯分布,而wi是第i个高斯的加权系数,满足
Figure BDA0000067517050000092
M是高斯总数。
在本发明实施例中,可以综合考虑计算复杂度和训练数据数量受限的模型的模拟精确度,设定注册用户声纹模型的高斯数M值为32,而通用的仿冒者声纹模型的高斯数M值为1024。所有模型参数mi、si以及wi都由系统利用用户声纹特征建模。
步骤204,根据得到的第一相似度和第二相似度计算似然比。
即计算上述语音信号相对于用户声纹模型及仿冒者声纹模型相似度的似然比P=p(X|U)/p(X|G)。
步骤205,如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
也就是说,上述比值P大于Pt,则可认为该语音更大可能为注册用户的语音,反之即可能为仿冒者的语音。Pt可以是一个预设的参数,主要用于控制检测的敏感度。一般来说,Pt越大则对用户发音要求更高,要求用户在后续使用中的发音尽可能接近其注册时的语音特征。Pt值的设定依赖于语音特征的提取和统计模型的选择,若选择的特征和模型较为鲁棒,则系统容错能力较强,可以设置较大的Pt以提高精度。
当然,在具体应用中,还可以采用其他方式对用户身份有效性进行验证,对此本发明实施例不做限定。
在本发明实施例中,可以通过对接收到的语音信号进行语音识别,并通过关键字检索等技术判断用户当前请求登录的网站。
如图3所示,是本发明实施例中网站名解析的流程图,包括以下步骤:
步骤301,从输入的语音信号中提取声学特征。
原始的语音信号中往往含有各种冗余信息,对系统运算效率和识别性能都有一定的影响。为此,在本发明实施例中,可以从原始语音信号中提取语音的声学特征。考虑到语音信号的时变特性,可以从相对平稳的短时语音帧上提取特征。具体地,可以选用语音识别领域常用的MFCC特征,按照时序顺序依次对窗长25ms帧移10ms的短帧语音做频谱变换得到M维MFCC参数(例如选择M=39),将原始的易受噪音干扰的语音信号转换为具有更高鲁棒性的声学特征。这样,可以将原本连续的语音信号表征为一系列的特征矢量O=(O1,O2,…,OT),其中T为语音段总帧数。
步骤302,利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串。
由于汉语字符过多,如果对每个字符单独建模,一方面模型参量太大,另一方面计算量也会急剧增加,因此,在实际应用中,可以考虑仅对400多个音节分别建模,对提取得到的声学特征O实现从连续语音到音节串的匹配。这样通过连续语音识别、模型匹配得到最优音节串识别结果,即得到最优的音节候选串。
步骤303,将所述音节候选串与预置的网站关键词表中的关键词进行匹配。
可以在移动设备中预置基于网站名的关键词表,建立从音节识别结果到词表内每个词的索引,将音节候选串与所述关键词选中的关键词进行匹配,得到所有可能相关的关键词。
步骤304,根据匹配结果,确定用户请求访问的网站。
比如,可以将预置的网站关键词表中的关键词扩展成拼音串序列,根据预置的拼音混淆度表(该拼音混淆度表记录了两两拼音单元之间的混淆度,如w和en的混淆度为0,en和en的混淆度为1,en和eng的混淆度为0.8等)计算上述各音节候选串与各关键词拼音串最高匹配得分。选择匹配得分最高的音节候选串对应的关键词作为用户请求访问的网站。
当然,在具体应用中,还可以采用其他方式进行网站名解析,对此本发明实施例不做限定。
需要说明的是,本发明实施例移动设备对网站访问的方法,可以单独应用于移动设备客户端,为了降低移动设备的运算压力,也可以由移动设备客户端和服务器端来共同实现。
相应地,本发明实施例还提供一种移动设备,如图4所示,是该移动设备的一种结构示意图。
在该实施例中,所述移动设备包括:
语音信息接收单元401,用于接收用户访问网站的语音信号;
身份验证单元402,用于根据所述语音信号进行用户身份有效性验证;
解析单元403,用于根据所述语音信号进行网站名解析;
访问单元404,用于根据身份验证单元402得到的用户身份验证结果向解析单元403解析得到的网站发送访问请求。
可见,本发明实施例的移动设备,只需用户通过语音指令的方式发出网站登录请求,在移动设备对用户身份验证后自动实现登录,无需移动设备用户输入用户名及密码,避免了小屏幕设备上输入的困难及账号管理的困扰,通过对用户身份的验证实现对访问网站的自动登录,有效地提高了访问效率。
在本发明实施例中,上述身份验证单元402的一种优选实施例包括:声纹特征提取子单元、第一匹配子单元、第二匹配子单元、计算子单元和第一确定子单元。其中:
所述声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
所述第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
所述第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
所述计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
所述第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
在本发明实施例中,上述解析单元403的一种优选实施例包括:声学特征提取子单元、语音识别子单元、关键词匹配子单元和第二确定子单元。其中:
所述声学特征提取子单元,用于从所述语音信号中提取声学特征;
所述语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
所述关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
所述第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
在本发明实施例中,上述访问单元404的一种优选实施例包括:判断子单元、注册子单元、第一发送子单元和第二发送子单元。其中:
所述判断子单元,用于在所述身份验证单元402的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
所述注册子单元,用于在所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
所述第一发送子单元,用于在所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
所述第二发送子单元,用于在所述身份验证单元402的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求。
需要说明的是,上述身份验证单元402、解析单元403和访问单元404还可以有其他实现方式,对此本发明实施例不做限定。
如图5所示,是本发明实施例移动设备的另一种结构示意图。
与图4所示实施例不同的是,在该实施例中,所述移动设备还进一步包括:
预处理单元501,用于对语音信息接收单元401接收的语音信号进行降噪处理。具体地,可以首先通过对语音信号的短时能量和短时过零率分析,将连续的语音信号分割成独立的语音片断和非语音片断,然后对分割得到的语音片断进行语音增强处理,在进行语音增强处理时,可以通过维纳滤波,将语音信号中的环境噪声进一步消除,以提高后续系统对该信号的处理能力。
相应地,身份验证单元402和解析单元403需要分别根据预处理单元501降噪处理后的语音信号进行用户身份有效性验证和网站名解析。
通过预处理单元501对对语音信息的预处理,可以进一步提高身份验证单元402和解析单元403对用户语音信号的识别处理能力。
相应地,本发明实施例还提供一种移动设备对网站访问的系统,如图6所示,是该系统的一种结构示意图。
在该实施例中,所述系统包括:客户端601和服务器602。其中:
客户端601设置在移动设备上,接收用户访问网站的语音信号,并将所述语音信号发送给服务器602。上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
服务器602接收到客户端601发送的语音信号后,根据所述语音信号进行用户身份有效性验证以及网站名解析,并将用户身份验证结果及解析得到的网站名返回给客户端601。
客户端601根据所述服务器602返回的用户身份验证结果向所述网站名对应的网站603发送访问请求。
具体地,客户端601向网站603发送访问请求可以有以下几种情况:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
可见,本发明实施例移动设备对网站访问的系统,将不同功能分散到用户移动设备和服务器来分别完成。用户移动设备主要用于跟踪用户网站登录指令;而服务器实现用户注册,身份验证等运算功能和信息管理。网站响应服务器发送的验证后的用户登录请求,并向客户端发送用户个性化网页。不仅大大降低了移动设备用户网站登录的复杂性,而且也不会给移动设备增加过多的负荷。
另外,在本发明另一实施例中,上述客户端601还可进一步用于在根据所述语音信号进行网站名解析、并将所述语音信号发送给所述服务器之前对所述语音信号进行降噪处理。这样,可有效提高客户端和服务器对用户语音信号的识别处理能力,提高系统的鲁棒性。
需要说明的是,上述客户端601和服务器602的上述各功能可以由相应的功能单元来实现,具体与图4和图5所示实施例中功能单元类似,在此不再详细描述。
如图7所示,是本发明实施例移动设备对网站访问的系统的另一种结构示意图。
在该实施例中,所述系统包括:客户端701和服务器702。其中:
客户端701设置在移动设备上,接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给服务器702。上述语音信号可以是包含网站名信息的任意网站浏览指令,比如:“新浪”、“去搜狐”,“前往合肥论坛”等语音信号。
服务器702接收到客户端701发送的上述声纹特征和声学特征后,根据所述声纹特征进行用户身份有效性验证,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给客户端701。
客户端701根据服务器702返回的用户身份验证结果向所述网站名对应的网站703发送访问请求。
具体地,客户端701向网站703发送访问请求可以有以下几种情况:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
可见,本发明实施例移动设备对网站访问的系统,将不同功能分散到用户移动设备和服务器来分别完成。用户移动设备主要用于跟踪用户网站登录指令并完成简单的信号分析;而服务器实现用户注册,身份验证及网站名解析等运算功能和信息管理。网站响应服务器发送的验证后的用户登录请求,并向客户端发送用户个性化网页。不仅大大降低了移动设备用户网站登录的复杂性,而且也不会给移动设备增加过多的负荷。本发明实施例移动设备对网站访问的系统,将所有的模型资源以及计算都放在服务器端执行,有效地减少了客户端的储存和运算压力。
另外,在本发明另一实施例中,上述客户端701还可进一步用于在在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。这样,可有效提高客户端和服务器对用户语音信号的识别处理能力,提高系统的鲁棒性。
需要说明的是,上述客户端701和服务器702的上述各功能可以由相应的功能单元来实现,具体与图4和图5所示实施例中功能单元类似,在此不再详细描述。
本发明实施例移动用户访问网站的方法、设备及系统,可以支持移动用户登录各类网站,包括已注册网站和未注册网站,而且在对用户登录身份有效性验证后直接向网站发出相应的登录请求,无需用户手工注册,而是由系统自动检测自动注册帐号。另外,由于每次用户登录都进行了身份验证,从而可以充分保证用户个人信息的安全。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (15)

1.一种移动用户访问网站的方法,其特征在于,包括:
接收用户访问网站的语音信号;
根据所述语音信号进行用户身份有效性验证以及网站名解析;
根据用户身份验证结果向解析得到的网站发送访问请求。
2.如权利要求1所述的方法,其特征在于,所述根据所述语音信号进行用户身份有效性验证包括:
从所述语音信号中提取声纹特征;
将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
根据得到的第一相似度和第二相似度计算似然比;
如果所述似然比大于预设值,则确定所述用户是当前移动设备的合法用户。
3.如权利要求1所述的方法,其特征在于,所述根据所述语音信号进行网站名解析包括:
从所述语音信号中提取声学特征;
利用提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
根据匹配结果,确定用户请求访问的网站。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:在根据所述语音信号进行用户身份有效性验证以及网站名解析之前,对所述语音信号进行降噪处理。
5.如权利要求1至4任一项所述的方法,其特征在于,所述根据用户身份验证结果向解析得到的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
6.一种移动设备,其特征在于,包括:
语音信息接收单元,用于接收用户访问网站的语音信号;
身份验证单元,用于根据所述语音信号进行用户身份有效性验证;
解析单元,用于根据所述语音信号进行网站名解析;
访问单元,用于根据所述身份验证单元得到的用户身份验证结果向所述解析单元解析得到的网站发送访问请求。
7.如权利要求6所述的移动设备,其特征在于,所述身份验证单元包括:
声纹特征提取子单元,用于从所述语音信号中提取声纹特征;
第一匹配子单元,用于将所述声纹特征与当前移动设备注册用户的声纹模型进行匹配,得到第一相似度;
第二匹配子单元,用于将所述声纹特征与背景模型或仿冒者声纹模型进行匹配,得到第二相似度;
计算子单元,用于根据得到的第一相似度和第二相似度计算似然比;
第一确定子单元,用于在所述计算子单元计算得到的似然比大于预设值时,确定所述用户是当前移动设备的合法用户。
8.如权利要求6所述的移动设备,其特征在于,所述解析单元包括:
声学特征提取子单元,用于从所述语音信号中提取声学特征;
语音识别子单元,用于利用所述声学特征提取子单元提取的声学特征进行连续语音识别,得到一个或多个音节候选串;
关键词匹配子单元,用于将所述音节候选串与预置的网站关键词表中的关键词进行匹配;
第二确定子单元,用于根据所述关键词匹配子单元的匹配结果,确定用户请求访问的网站。
9.如权利要求6所述的移动设备,其特征在于,所述移动设备还包括:
预处理单元,用于对所述语音信息接收单元接收的语音信号进行降噪处理。
10.如权利要求6至9任一项所述的移动设备,其特征在于,所述访问单元包括:
判断子单元,用于在所述身份验证单元的用户身份验证结果是所述用户是当前移动设备的合法用户时,判断所述用户是否为首次登录所述解析得到的网站;
注册子单元,用于在所述判断子单元判断所述用户是首次登录所述网站时,向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
第一发送子单元,用于在所述判断子单元判断所述用户不是首次登录所述网站时,提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
第二发送子单元,用于在所述身份验证单元的用户身份验证结果是所述用户不是当前移动设备的合法用户时,向所述网站发送匿名登录请求。
11.一种移动用户访问网站的系统,其特征在于,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,并将所述语音信号发送给所述服务器;
所述服务器,用于接收所述客户端发送的语音信号,并根据所述语音信号进行用户身份有效性验证以及网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
12.如权利要求11所述的系统,其特征在于,
所述客户端,还用于在将所述语音信号发送给所述服务器之前,对所述语音信号进行降噪处理。
13.如权利要求11或12所述的系统,其特征在于,所述客户端根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求包括:
如果用户身份验证结果是所述用户是当前移动设备的合法用户,则判断所述用户是否为首次登录所述解析得到的网站;
如果所述用户是首次登录所述网站,则向所述网站发送注册请求,完成所述用户在所述网站的注册过程;
如果所述用户不是首次登录所述网站,则提取所述用户的用户名,向所述网站发送包含所述用户名的登录请求;
如果用户身份验证结果是所述用户不是当前移动设备的合法用户,则向所述网站发送匿名登录请求。
14.一种移动用户访问网站的系统,其特征在于,包括:客户端和服务器;
所述客户端,用于接收用户访问网站的语音信号,从所述语音信号中提取声纹特征和声学特征,并将所述声纹特征和声学特征发送给所述服务器;
所述服务器,用于接收所述客户端发送的所述声纹特征和声学特征,并根据所述声纹特征进行用户身份有效性验证,根据所述声学特征进行网站名解析,并将用户身份验证结果及解析得到的网站名返回给所述客户端;
所述客户端,还用于根据所述服务器返回的用户身份验证结果向所述网站名对应的网站发送访问请求。
15.如权利要求14所述的系统,其特征在于,
所述客户端,还用于在从所述语音信号中提取声纹特征和声学特征之前,对所述语音信号进行降噪处理。
CN201110156221.4A 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及系统 Active CN102223367B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110156221.4A CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110156221.4A CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及系统

Publications (2)

Publication Number Publication Date
CN102223367A true CN102223367A (zh) 2011-10-19
CN102223367B CN102223367B (zh) 2014-04-23

Family

ID=44779796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110156221.4A Active CN102223367B (zh) 2011-06-10 2011-06-10 移动用户访问网站的方法、设备及系统

Country Status (1)

Country Link
CN (1) CN102223367B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及系统
CN103107974A (zh) * 2011-11-09 2013-05-15 腾讯科技(深圳)有限公司 一种用户注册和登录方法和移动终端
CN103379144A (zh) * 2012-04-18 2013-10-30 爱国者电子科技有限公司 云存储移动装置及云存储数据的云存储方法
CN103442130A (zh) * 2013-04-10 2013-12-11 威盛电子股份有限公司 语音操控方法、移动终端装置及语音操控系统
CN103581109A (zh) * 2012-07-19 2014-02-12 纽海信息技术(上海)有限公司 声纹登录购物系统和方法
CN103942230A (zh) * 2013-01-21 2014-07-23 上海智臻网络科技有限公司 一种用于进行语音网页导航的方法、装置和系统
CN103943110A (zh) * 2013-01-21 2014-07-23 联想(北京)有限公司 控制方法、装置和电子设备
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN104485102A (zh) * 2014-12-23 2015-04-01 智慧眼(湖南)科技发展有限公司 声纹识别方法和装置
CN104732974A (zh) * 2013-12-19 2015-06-24 国家电网公司 智能录音识别系统
CN104821882A (zh) * 2015-05-08 2015-08-05 南京财经大学 一种基于语音生物特征的网络安全验证方法
CN106911687A (zh) * 2017-02-20 2017-06-30 深圳国泰安教育技术股份有限公司 一种页面构建控制方法和装置
CN107046517A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 一种语音处理方法、装置和智能终端
CN103379144B (zh) * 2012-04-18 2018-02-09 爱国者安全科技(北京)有限公司 云存储移动装置及云存储数据的云存储方法
CN105556920B (zh) * 2013-09-16 2018-11-09 高通股份有限公司 用于控制对应用程序的访问的方法和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN101308654A (zh) * 2007-05-14 2008-11-19 华为技术有限公司 一种语音分析识别方法、系统与装置
CN101464896A (zh) * 2009-01-23 2009-06-24 安徽科大讯飞信息科技股份有限公司 语音模糊检索方法及装置
CN101989299A (zh) * 2010-08-30 2011-03-23 无锡滨达工业创意设计有限公司 基于互联网的语音搜索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1447278A (zh) * 2002-11-15 2003-10-08 郑方 一种声纹识别方法
CN101308654A (zh) * 2007-05-14 2008-11-19 华为技术有限公司 一种语音分析识别方法、系统与装置
CN101464896A (zh) * 2009-01-23 2009-06-24 安徽科大讯飞信息科技股份有限公司 语音模糊检索方法及装置
CN101989299A (zh) * 2010-08-30 2011-03-23 无锡滨达工业创意设计有限公司 基于互联网的语音搜索方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103107974B (zh) * 2011-11-09 2018-01-09 腾讯科技(深圳)有限公司 一种用户注册和登录方法和移动终端
CN103107974A (zh) * 2011-11-09 2013-05-15 腾讯科技(深圳)有限公司 一种用户注册和登录方法和移动终端
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及系统
CN103379144A (zh) * 2012-04-18 2013-10-30 爱国者电子科技有限公司 云存储移动装置及云存储数据的云存储方法
CN103379144B (zh) * 2012-04-18 2018-02-09 爱国者安全科技(北京)有限公司 云存储移动装置及云存储数据的云存储方法
CN103581109B (zh) * 2012-07-19 2018-03-02 北京京东尚科信息技术有限公司 声纹登录购物系统和方法
CN103581109A (zh) * 2012-07-19 2014-02-12 纽海信息技术(上海)有限公司 声纹登录购物系统和方法
CN103942230A (zh) * 2013-01-21 2014-07-23 上海智臻网络科技有限公司 一种用于进行语音网页导航的方法、装置和系统
CN103942230B (zh) * 2013-01-21 2017-03-29 上海智臻智能网络科技股份有限公司 一种用于进行语音网页导航的方法、装置和系统
CN103943110A (zh) * 2013-01-21 2014-07-23 联想(北京)有限公司 控制方法、装置和电子设备
CN103442130A (zh) * 2013-04-10 2013-12-11 威盛电子股份有限公司 语音操控方法、移动终端装置及语音操控系统
CN105556920B (zh) * 2013-09-16 2018-11-09 高通股份有限公司 用于控制对应用程序的访问的方法和设备
CN104732974A (zh) * 2013-12-19 2015-06-24 国家电网公司 智能录音识别系统
CN104732974B (zh) * 2013-12-19 2019-05-24 国家电网公司 智能录音识别系统
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
CN104485102A (zh) * 2014-12-23 2015-04-01 智慧眼(湖南)科技发展有限公司 声纹识别方法和装置
CN104821882A (zh) * 2015-05-08 2015-08-05 南京财经大学 一种基于语音生物特征的网络安全验证方法
CN107046517A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 一种语音处理方法、装置和智能终端
CN106911687A (zh) * 2017-02-20 2017-06-30 深圳国泰安教育技术股份有限公司 一种页面构建控制方法和装置
CN106911687B (zh) * 2017-02-20 2020-04-10 深圳国泰安教育技术有限公司 一种页面构建控制方法和装置

Also Published As

Publication number Publication date
CN102223367B (zh) 2014-04-23

Similar Documents

Publication Publication Date Title
CN102223367B (zh) 移动用户访问网站的方法、设备及系统
JP7110292B2 (ja) 話者検証のためのニューラルネットワーク
CN102238189B (zh) 声纹密码认证方法及系统
CN110310623B (zh) 样本生成方法、模型训练方法、装置、介质及电子设备
EP2273412B1 (en) User verification with a multimodal web-based interface
US8793135B2 (en) System and method for auditory captchas
US20060206333A1 (en) Speaker-dependent dialog adaptation
CN102238190B (zh) 身份认证方法及系统
Adorf Web speech API
Darabkh et al. An efficient speech recognition system for arm‐disabled students based on isolated words
CN110534099A (zh) 语音唤醒处理方法、装置、存储介质及电子设备
CN104104664A (zh) 对验证码进行验证的方法、服务器、客户端和系统
CN106415719A (zh) 使用说话者识别的语音信号的稳健端点指示
CN105940407A (zh) 用于评估音频口令的强度的系统和方法
CN102510426A (zh) 个人助理应用访问方法及系统
CN109637520A (zh) 基于语音分析的敏感内容识别方法、装置、终端及介质
CN104347075A (zh) 以语音识别来选择控制客体的装置及方法
CN102413101A (zh) 声纹密码语音提示的声纹认证系统及其实现方法
EP3989217A1 (en) Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium
CN105654955A (zh) 语音识别方法及装置
CN109841218A (zh) 一种针对远场环境的声纹注册方法及装置
CN105047192A (zh) 基于隐马尔科夫模型的统计语音合成方法及装置
CN112927674A (zh) 语音风格的迁移方法、装置、可读介质和电子设备
CN112417412A (zh) 一种银行账户余额查询方法、装置及系统
Das et al. Multi-style speaker recognition database in practical conditions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: IFLYTEK CO., LTD.

Free format text: FORMER NAME: ANHUI USTC IFLYTEK CO., LTD.

CP03 Change of name, title or address

Address after: Wangjiang Road high tech Development Zone Hefei city Anhui province 230088 No. 666

Patentee after: Iflytek Co., Ltd.

Address before: 230088 No. 616, Mount Huangshan Road, hi tech Development Zone, Anhui, Hefei

Patentee before: Anhui USTC iFLYTEK Co., Ltd.