CN111415683A - 语音识别异常告警方法、装置、计算机设备和存储介质 - Google Patents
语音识别异常告警方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111415683A CN111415683A CN202010090246.8A CN202010090246A CN111415683A CN 111415683 A CN111415683 A CN 111415683A CN 202010090246 A CN202010090246 A CN 202010090246A CN 111415683 A CN111415683 A CN 111415683A
- Authority
- CN
- China
- Prior art keywords
- log data
- matching
- data
- analyzed
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000005856 abnormality Effects 0.000 title claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 37
- 238000004140 cleaning Methods 0.000 claims abstract description 20
- 238000012795 verification Methods 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000000611 regression analysis Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims 1
- 238000011010 flushing procedure Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请属于计算机领域,公开了一种语音识别异常告警方法、装置、计算机设备及可读存储介质。所述方法包括对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据;清洗所述待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列;获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,其中,所述预设匹配关键字包括表示语音长度的length、表示语音速度的speed;若分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。采用本方法解决了不能对语音识别时出现的问题进行及时地定位的技术问题。
Description
技术领域
本申请涉及计算机领域,特别是涉及一种语音识别异常告警方法、装置、计算机设备和存储介质。
背景技术
语音识别是人工智能领域重要的技术,是人机交互的重要途径。在安卓、iOS等等移动设备端嵌入的原生语音SDK性能一般都比较良好,同时基于原生的架构也更容易发现和定位语音识别过程中出现的问题。而在PC端浏览器上一般采用IE语音插件,而浏览器的权限不如SDK强,所能获取的运行信息有限,会导致难以发现和定位用户在使用PC端浏览器进行语音识别是出现的语音断句的问题。一旦出现这种问题,则需要远程到用户电脑上获取日志文件数据,然后再对获取到的日志文件进行分析。这样不能对问题进行及时地定位和处理,问题解决的速率极低。
发明内容
基于此,有必要针对上述技术问题,本申请提供一种语音识别异常告警方法、装置、计算机设备及存储介质,以提高对语音识别过程中出现的问题进行及时定位的效率。
一种语音识别异常告警方法,所述方法包括:
对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据;
清洗所述待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列;
获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,其中,所述预设匹配关键字包括表示语音长度的length、表示语音速度的speed;
若所述分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
一种语音识别异常告警装置,所述装置包括:
合法校验模块,用于对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据;
字段清洗模块,用于清洗所述待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列;
数据分析模块,用于获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,其中,所述预设匹配关键字包括表示语音长度的length、表示语音速度的speed;
异常告警模块,用于若所述分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音识别异常告警方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音识别异常告警方法的步骤。
上述语音识别异常告警方法、装置、计算机设备和存储介质,通过对采集到的日志数据进行清洗、字段拆解等处理后,根据设定的匹配模式提取待匹配数据序列中的特定关键字,然后对这些特定关键字所对应的数值进行趋势分析,得到这些数值是否命中预设的匹配模式,然后生成异常告警指令,因为实时获取到了日志数据并获取到的日志数据进行处理,而且只要提供预设的匹配模式便可以很及时的获取到语音转化过程中出现的问题,并对问题进行定位,提高了异常问题的定位效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为语音识别异常告警方法的应用环境示意图;
图2为语音识别异常告警方法的流程示意图;
图3为图2中步骤202的流程示意图;
图4为图2中步骤206的流程示意图;
图5为语音识别异常告警装置的示意图;
图6为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的语音识别异常告警方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络106以及服务端104,网络106用于在终端102和服务端104之间提供通信链路介质,网络106可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络106与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的语音识别异常告警方法一般由服务端/终端执行,相应地,语音识别异常告警装置一般设置于服务端/终端设备中。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络106与服务端104进行通信。服务器104通过网络106从终端102获取语音识别时生成的语音识别日志数据,并对日志数据进行清洗、字段拆解关键字数值分析预测等操作后得到分析结果,并判断分析结果是否命中预设匹配模式,若命中,则根据命中的预设匹配模式生成告警指令。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种语音识别异常告警方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据。
在将语音转化为文档的语音识别场景中,如果语音识别出现异常需要通知后台及时对异常情况作出相应的处理。本实施例中获取语音识别是否异常是通过对语音识别过程中生成的日志数据进行分析得到的。
在浏览器端,原本语音插件加载后,只能实现将日志数据保存到本地,对于浏览器JavaScript和语音插件接口交互情况的日志手机非常不方便,所以本实施例可以采用埋点回传的方式获取日志数据。
具体地,对厂商提供原始的IE浏览器JavaScript调用语音插件的方式,前端层面先实现一层封装,在这层封装中实现调用语音功能前后的环境、输入、输出反序列化成文本语言,实现是的每次调用封装方式时都会将通过语音插件接口返回的日志数据通过非阻塞的Ajax异步post请求的方式发送到服务端上指定的后台接口。而该后台接口则会监听日志回传请求,并对该日志回传请求进行合法性校验后,将日志数据转发到服务端上的预设数据库中,作为待分析日志数据。
通常的语音识别中,可能会出现断句判断异常(在长语音中需要分出逗号、句号和段落等),比如语音卡顿、断句失败等异常。而对这些异常出现的原因进行定位困难的原因在于:上述问题可能是用于口音问题,也可能是设备电脑问题、网络问题,所以难以判断。
采集语音识别的日志数据流程具体可以是,针对每一条语音,都需要获取用于从输入语音开始转化的时间t1,语音转化完成的时间t2,然后根据t1和t2获取语音转化的总时间T;语音转化过程中的文本数据、语速speed、语音长度length、语音数据大小、语音是否正常结束的pgs、以及语音转化的速度等等,将采集到的这些数据按照一定的顺序进行整合组成一条日志信息作为日志数据。
具体地,在语音识别过程中会生成若干条日志数据,每一条日志数据中的某些属性所对应的数据都是相对于前一条有所改变。
步骤204,清洗待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列。
接收到的待分析日志数据一般会出现字段缺失等情况,所以需要对待分析日志进行字段清洗的操作。在数据挖掘过程中,数据清洗主要根据探索性分析后得到的一些结论入手,然后主要对四类异常数据进行处理;分别是缺失值(missing value),异常值(离群点),去重处理(Duplicate Data)以及噪音数据的处理。一般对语音转化的日志数据需要进行缺失值的数据清洗操作,以保证日志数据中每一个属性所对应的数值都不为空。在日志数据的属性值缺失率比较少的情况下,则可以根据数据分布的情况对缺失的数值直接进行填充即可,例如:有一个全局常量“length”的后数值缺失,则可以根据日志数据中已经存在的全局常量的数值对该缺失值进行填充。
进一步地,清洗后得到的日志数据只是一条输出正常的日志数据,还需要根据正则表达式对日志数据进行字段拆解,得到属性与数值一一对应的数据序列,其可视化的表现形式如表1中所示,然后将该数据序列作为待匹配数据序列,其中,同一个Sid的同一个数据具有相同的标识号比如1e212651700c4e7,length代表在该条日志数据中已识别中的语音长度,speed表示该该条日志数据中检测到的语音速度大小。
Sid | Length | Pgs | Speed |
1e212651700c4e7 | 2 | 2 | 200 |
1e212651700c4e7 | 4 | 0 | 400 |
1e212651700c4e7 | 5 | 0 | 500 |
1e212651700c4e7 | 6 | 0 | 600 |
表1
步骤206,获取预设匹配关键字,从待匹配数据序列中获取与预设匹配关键字对应的匹配数值,并根据匹配数值得到分析结果,其中,预设匹配关键字包括表示语音长度的length、表示语音速度的speed。
服务端会先根据预定的模式扫描待匹配数据序列,定位预设匹配关键字在待匹配数据序列中的位置,以及预设匹配关键字所对应的数据,作为匹配数值,其中,该匹配数值是一般是多条数据。比如:
代表用户语速的speed,不同时间点的语速也不相同:200字/min、400字/min、500字/min、600字/min。还有代表语音时长的length、代表语音识别是否正常结束的pgs等等。一般预设关键字的数量为多个以保证得到的分析结果更加准确。
步骤208,若分析结果为匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
预设匹配模式为校验得到的预设匹配关键字所对应的数据是否命中预设的数据分布,若命中,则认为该匹配数值所对应的当前语音识别出现异常,则生成当前语音识别异常的告警指令提醒开发者或者分析者语音识别出现异常。一般,若语音识别的开始生成的第一条日志信息的pgs的数值为2,中间为0,而最后一条日志信息的pgs的数值为1,则可以认为该语音识别正常结束。若多条日志信息中的语音长度或者这话后得到的文本长度length都为0,则说明语音长度不符合预设语音长度,可以认为输入端未有语音输入,虽然pgs数值正常,语音转化正常结束,也可以认为是当前语音识别出现了异常,可能是用户的输入设备出现了问题,比如用户的设备话筒出现了问题,则可以生成与该异常问题对应的告警信息,并将该告警信息发送给用户。
上述语音识别异常告警方法中,通过对采集到的日志数据进行清洗、字段拆解等处理后,根据设定的匹配模式提取待匹配数据序列中的特定关键字,然后对这些特定关键字所对应的数值进行趋势分析,得到这些数值是否命中预设的匹配模式,然后生成异常告警指令,因为实时获取到了日志数据并获取到的日志数据进行处理,而且只要提供预设的匹配模式便可以很及时的获取到语音转化过程中出现的问题,并对问题进行定位,场景覆盖率80%,问题解决时效提升180%。
在一个实施例中,如图3所示,步骤202包括:
步骤302,为每一条采集到的日志数据生成日志回传请求,并通过Ajax异步post请求将日志回传请求发送到预设数据库中。
对于采集到的每一条日志数据,要对它的日志回传请求进行合法性校验,以确认采集到的该日志回传请求的来源是否合法、请求签名参数是否被恶意篡改以及请求是否具有唯一性(不可复制),防止请求被恶意攻击等。为了保证数据在通信时的安全性,我们可以采用token来进行相关合法性验证。其中,token的意思是“令牌”,是服务端生成的一串字符串,作为客户端进行请求的一个标识,日志回传请求就相当于一个token,简单token的组成可以是uid(用户唯一的身份标识)、time(当前时间的时间戳)、sign(签名,token的前几位以哈希算法压缩成的一定长度的十六进制字符串用来防止token泄露)。
步骤304,将日志回传请求中的请求签名参数对象序列化为json格式的字符串,并与预设校验信息进行一致性对比,得到校验结果。
具体地,将该日志回传请求的请求签名参数对象序列化为json格式字符串后与预设校验信息进行对比,得到校验结果,如果校验结果为请求签名参数XXX和服务端计算得到result完全相同,则认为该日志回传请求合法,其中,预设校验信息便是服务端按照同样的条件重新计算得到的result;则将该日志回传请求对应的日志数据作为待分析日志数据。
步骤306,若校验结果为请求签名参数与预设校验信息完全相同,则将与日志回传请求对应的日志数据作为待分析日志数据。
校验结果为请求签名参数与预设校验信息完全相同则表示请求合法,则正常读取日志数据,若不相同的话,则请求可能有被恶意篡改,则可以禁止访问相应的数据,并向服务端返回错误信息。
本实施例通过校验日志回传请求的合法性以确认采集到的该日志回传请求的来源是否合法、请求的参数是否被恶意篡改以及请求的唯一性(不可复制),防止请求被恶意攻击,保证日志数据的安全性。
在一个实施例中,步骤204包括:
计算待分析日志数据的字段的缺失值比例,并根据缺失值比例以及字段重要性删除缺失值。
进一步地,因为不同的日志数据中的缺失值的重要性以及缺失率不同,所以对不同情况也会有不同的处理方式。比如,当缺失率比较高,而且属性的重要程度比较低,缺失后对分析的结果影响不大时,可以直接删除该属性以及该属性所对应的数值,而本实施例以删除缺失值为例进行说明,除了删除缺失值,本实施例该可以采用一下方式对待分析日志数据进行清洗操作。
当缺失率高,但属性重要程度高时,主要使用的方式有插补法和建模法。
(1)插补法主要有随机插补法,多重插补法,热平台插补法,以及拉格朗日插值法与牛顿插值法
a.随机插补法--从总体中随机抽取某几个样本代替缺失样本;
b.多重插补法--通过变量之间的关系对缺失数据进行预测,利用蒙特卡洛方法生成多个完整的数据集,在对这些数据集进行分析,最后对分析结果进行汇总处理;
c.热平台插补----指在非缺失数据集中找到一个与缺失值所在样本相似的样本(匹配样本),利用其中的观测值对缺失值进行插补。热平台插补法的优点就在于简单易行,准确率较高。
d.拉格朗日差值法和牛顿插值法。
(2)建模法
可以用回归、贝叶斯、随机森林、决策树等模型对缺失数据进行预测。例如:利用数据集中其他数据的属性,可以构造一棵判定树,来预测缺失值的值。
一般而言,数据缺失值的处理没有统一的流程,必须根据实际数据的分布情况,倾斜程度,缺失值所占比例等来选择方法,本实施例不做限定。
进一步地,在对待分析日志数据进行清洗后还需根据正则表达式将所述待分析日志数据转化为属性与数值一一对应的数据序列,作为所述待匹配数据序列。因为清洗后得到的日志数据只是一条输出正常的日志数据,还需要根据正则表达式对日志数据进行字段拆解,得到属性与数值一一对应的数据序列,然后将该数据序列作为待匹配数据序列,以方便数据的整合和处理。
本实施例中通过对待分析日志数据进行字段清洗操作保证清洗后的日志数据中属性所对应的数值不为空,确保数据分析时的精确度。
在一个实施例中,如图4所示,步骤206包括:
步骤402,定位预设匹配关键字在待匹配日志数据中的位置,并获取与预设匹配关键字所对应的数值,作为匹配数值。
预设匹配关键字可以是代表用户语速的speed、代表语音时长的length、代表语音识别是否正常结束的pgs等等。匹配数值是与预设匹配关键字对应的数值,比如:代表用户语速的speed,不同时间点的语速也不相同:200、400、500、600字/min。还有代表语音时长的length、代表语音识别是否正常结束的pgs等等。一般预设关键字的数量为多个,以保证得到的分析结果更加准确。
步骤404,对匹配数值进行回归分析,得到每个预设匹配关键字的回归结果,作为回归预测结果。
具体地,获取表示语音长度的关键字“length”、代表语音识别是否正常结束的关键字pgs,并获取关键字length与pgs下所有的数值,作为匹配数值,并根据回归分析方法对匹配数值进行线性回归分析得到线性回归分析结果,作为回归预测结果。当然,除了对匹配数据进行回归处理外,还可以进行拟合处理,得到预测结果,本实施例对此不作限定,可以根据具体情况而定。
本实施例中通过获取与预设匹配关键字的数值作为匹配数值,并对匹配数值进行处理分析,得到匹配数值的具体趋势,作为分析结果,以便于后续结果对比更加方便。
在一个实施例中,步骤208包括:
若分析结果为表示语音长度的length的数值不在历史拟合曲线范围内,则命中预设匹配模式的输入设备异常,则生成输入设备异常告警指令。当其他关键字所对应的数值正常,而表示语音长度的length所对应的数值不在历史拟合曲线的范围内,比如,length对应的数值连续为0,或者lenth数值拟合或回归,与历史数据得到的历史拟合曲线差距较大,说明语音录取设备存在问题存在,漏录入或者设备失效。当然在这种情况下会优先考虑语音的时长,而不会将语音速度设为考虑首选。
进一步地,预设匹配关键字还可以包括表示语音速度的speed,一般情况下是获取所有的关键字,然后对每一个关键字所对应的数值进行分析,得到分析结果。本实施例中,以关键字length为例进行说明。
可选的,若分析结果为表示语音速度的speed的数值连续落入预设语音速度内,则命中预设匹配模式的录入语速异常,则生成录入语速异常告警指令。
具体地,预设匹配模式可以是以下几种情况,然后根据以下几种预设匹配模式得到异常的结果:
1)语音长度lenth,若length对应的数值连续为0,或者lenth数值拟合或回归,与历史数据得到的历史拟合曲线差距较大,说明语音录取设备存在问题存在,漏录入或者设备失效;
2)语音识别的时间点time,若time时间连续性不平滑或者时间顺序不对,即不符合预设时间条件,说明可能存在网络延迟丢包或者引擎内部异常;
3)语音速度speed,若speed连续超过/低于历史平均值,说明可能用户语速过快过慢,即不符合预设语音速度,则可进行提示或者分析语速导致的准确性降低问题。
上述的历史拟合曲线、预设时间条件、预设语音速度以及上面提到的预设语音长度皆属于预设匹配模式。
本实施例通过对采集到的日志数据进行清洗、字段拆解等处理后,根据设定的匹配模式提取待匹配数据序列中的特定关键字,然后对这些特定关键字所对应的数值进行趋势分析,得到这些数值是否命中预设的匹配模式,然后生成异常告警指令,因为实时获取到了日志数据并获取到的日志数据进行处理,而且只要提供预设的匹配模式便可以很及时的获取到语音转化过程中出现的问题,并对问题进行定位,场景覆盖率80%,问题解决时效提升180%。
应该理解的是,虽然图2-图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种语音识别异常告警装置,该语音识别异常告警装置与上述实施例中语音识别异常告警方法一一对应。该语音识别异常告警装置包括合法校验模块502、字段清洗模块504、数据分析模块506、异常告警模块508,其中:
合法校验模块502,用于对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据。
字段清洗模块504,用于清洗待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列。
数据分析模块506,用于获取预设匹配关键字,从待匹配数据序列中获取与预设匹配关键字对应的匹配数值,并根据匹配数值得到分析结果,其中,预设匹配关键字包括表示语音长度的length、表示语音速度的speed。
异常告警模块508,用于若分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
进一步地,合法校验模块502,包括:
请求传输子模块,用于为每一条采集到的日志数据生成日志回传请求,并通过Ajax异步post请求将日志回传请求发送到预设数据库中。
一致校验子模块,用于将日志回传请求中的请求签名参数对象序列化为json格式的字符串,并与预设校验信息进行一致性对比,得到校验结果。
合法判断子模块,用于若校验结果为所述请求签名参数与预设校验信息完全相同,则将与日志回传请求对应的日志数据作为待分析日志数据。
进一步地,字段清洗模块504,包括:
字段删除子模块,用于计算待分析日志数据的字段的缺失值比例,并根据缺失值比例以及字段重要性删除缺失值。
进一步地,字段删除子模块包括:
比例计算单元,用于获取待分析日志数据中属性对象的数据值为空的数量,并计算数据值为空的数量在待分析日志数据中的比例,作为缺失值比例。
进一步地,字段清洗模块504,还包括:
字段拆解子模块,用于根据正则表达式将待分析日志数据转化为属性与数值一一对应的数据序列,作为待匹配数据序列。
进一步地,数据分析模块506,包括:
数值获取子模块,用于定位预设匹配关键字在待匹配日志数据中的位置,并获取与预设匹配关键字所对应的数值,作为匹配数值;
数值分析子模块,用于对匹配数值进行回归分析,得到每个预设匹配关键字的回归结果,作为回归预测结果。
进一步地,异常告警模块508,包括:
模式判断子模块,用于若分析结果为表示语音长度的length的数值不在历史拟合曲线范围内,则命中预设匹配模式的输入设备异常,则生成输入设备异常告警指令。
上述语音识别异常告警装置,通过对采集到的日志数据进行清洗、字段拆解等处理后,根据设定的匹配模式提取待匹配数据序列中的特定关键字,然后对这些特定关键字所对应的数值进行趋势分析,得到这些数值是否命中预设的匹配模式,然后生成异常告警指令,因为实时获取到了日志数据并获取到的日志数据进行处理,而且只要提供预设的匹配模式便可以很及时的获取到语音转化过程中出现的问题,并对问题进行定位,场景覆盖率80%,问题解决时效提升180%。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户订单数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音识别异常告警方法。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中语音识别异常告警方法的步骤,例如图2所示的步骤202至步骤208,或者,处理器执行计算机程序时实现上述实施例中语音识别异常告警装置的各模块/单元的功能,例如图5所示模块502至模块508的功能。为避免重复,此处不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中语音识别异常告警方法的步骤,例如图2所示的步骤202至步骤208,或者,处理器执行计算机程序时实现上述实施例中语音识别异常告警装置的各模块/单元的功能,例如图5所示模块502至模块508的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种语音识别异常告警方法,其特征在于,所述方法包括:
对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据;
清洗所述待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列;
获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,其中,所述预设匹配关键字包括表示语音长度的length、表示语音速度的speed;
若所述分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
2.根据权利要求1所述的方法,其特征在于,所述对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据,包括:
为每一条采集到的所述日志数据生成日志回传请求,并通过Ajax异步post请求将所述日志回传请求发送到预设数据库中;
将所述日志回传请求中的请求签名参数对象序列化为json格式的字符串,并与预设校验信息进行一致性对比,得到校验结果;
若所述校验结果为所述请求签名参数与所述预设校验信息完全相同,则将与所述日志回传请求对应的所述日志数据作为所述待分析日志数据。
3.根据权利要求1所述的方法,其特征在于,所述清洗所述待分析日志数据中的缺失值,包括:
计算所述待分析日志数据的字段的缺失值比例,并根据所述缺失值比例以及字段重要性删除所述缺失值。
4.根据权利要求3所述的方法,其特征在于,所述计算所述待分析日志数据的字段的缺失值比例,包括:
获取所述待分析日志数据中属性对象的数据值为空的数量,并计算所述数据值为空的数量在所述待分析日志数据中的比例,作为所述缺失值比例。
5.根据权利要求1所述的方法,其特征在于,所述根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列,包括:
根据正则表达式将所述待分析日志数据转化为属性与数值一一对应的数据序列,作为所述待匹配数据序列。
6.根据权利要求1所述的方法,其特征在于,所述获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,包括:
定位所述预设匹配关键字在所述待匹配日志数据中的位置,并获取与所述预设匹配关键字所对应的数值,作为所述匹配数值;
对所述匹配数值进行回归分析,得到每个所述预设匹配关键字的回归结果,作为回归预测结果。
7.根据权利要求1所述的方法,其特征在于,所述若所述分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令,包括:
若所述分析结果为表示语音长度的length的数值不在历史拟合曲线范围内,则命中所述预设匹配模式的输入设备异常,则生成输入设备异常告警指令。
8.一种语音识别异常告警装置,其特征在于,包括:
合法校验模块,用于对采集到的语音识别的日志数据进行合法性校验,得到待分析日志数据;
字段清洗模块,用于清洗所述待分析日志数据中的缺失值,并根据正则匹配对清洗后的待分析日志数据进行字段拆解,得到待匹配数据序列;
数据分析模块,用于获取预设匹配关键字,从所述待匹配数据序列中获取与所述预设匹配关键字对应的匹配数值,并根据所述匹配数值得到分析结果,其中,所述预设匹配关键字包括表示语音长度的length、表示语音速度的speed;
异常告警模块,用于若所述分析结果为所述匹配数值命中预设匹配模式,则生成当前语音识别异常的告警指令。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010090246.8A CN111415683A (zh) | 2020-02-13 | 2020-02-13 | 语音识别异常告警方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010090246.8A CN111415683A (zh) | 2020-02-13 | 2020-02-13 | 语音识别异常告警方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111415683A true CN111415683A (zh) | 2020-07-14 |
Family
ID=71492753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010090246.8A Pending CN111415683A (zh) | 2020-02-13 | 2020-02-13 | 语音识别异常告警方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111415683A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268476A (zh) * | 2021-06-07 | 2021-08-17 | 一汽解放汽车有限公司 | 应用于车联网的数据清洗方法、装置和计算机设备 |
CN114024872A (zh) * | 2020-07-17 | 2022-02-08 | 北京奇虎科技有限公司 | 语音语义平台异常报警方法、设备、存储介质及装置 |
CN114743542A (zh) * | 2022-04-29 | 2022-07-12 | 青岛海尔科技有限公司 | 语音处理的方法、装置、存储介质及电子装置 |
-
2020
- 2020-02-13 CN CN202010090246.8A patent/CN111415683A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114024872A (zh) * | 2020-07-17 | 2022-02-08 | 北京奇虎科技有限公司 | 语音语义平台异常报警方法、设备、存储介质及装置 |
CN113268476A (zh) * | 2021-06-07 | 2021-08-17 | 一汽解放汽车有限公司 | 应用于车联网的数据清洗方法、装置和计算机设备 |
CN114743542A (zh) * | 2022-04-29 | 2022-07-12 | 青岛海尔科技有限公司 | 语音处理的方法、装置、存储介质及电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111415683A (zh) | 语音识别异常告警方法、装置、计算机设备和存储介质 | |
CN111552633A (zh) | 接口的异常调用测试方法、装置、计算机设备及存储介质 | |
CN112559354A (zh) | 前端代码规范检测方法、装置、计算机设备及存储介质 | |
CN112394908A (zh) | 埋点页面自动生成的方法、装置、计算机设备及存储介质 | |
CN112631924A (zh) | 自动化测试方法、装置、计算机设备及存储介质 | |
CN112468658B (zh) | 语音质量检测方法、装置、计算机设备及存储介质 | |
CN112181835A (zh) | 自动化测试方法、装置、计算机设备及存储介质 | |
CN113377372A (zh) | 业务规则的解析方法、装置、计算机设备及存储介质 | |
JP2021192214A (ja) | アプリケーションの動作状態を検証する方法および装置 | |
CN111294347B (zh) | 一种工控设备的安全管理方法及系统 | |
CN112286815A (zh) | 一种接口测试脚本的生成方法及其相关设备 | |
CN113590447B (zh) | 埋点处理方法和装置 | |
RU2731122C1 (ru) | Способ, система и устройство для отображения текста | |
CN110727576A (zh) | 一种web页面测试方法、装置、设备及存储介质 | |
CN115827379A (zh) | 异常进程检测方法、装置、设备和介质 | |
CN110795424B (zh) | 特征工程变量数据请求处理方法、装置及电子设备 | |
CN115203674A (zh) | 一种应用程序自动登录方法、系统、装置及存储介质 | |
CN113779984A (zh) | 信息处理的方法、装置、服务器及计算机可读存储介质 | |
CN112948341A (zh) | 用于识别异常的网络设备日志的方法和装置 | |
CN112328381A (zh) | 启动任务执行顺序的决策方法、装置、计算机设备及介质 | |
CN111291186A (zh) | 一种基于聚类算法的上下文挖掘方法、装置和电子设备 | |
CN111131354A (zh) | 用于生成信息的方法和装置 | |
CN115718696B (zh) | 源码密码学误用检测方法、装置、电子设备和存储介质 | |
CN113535594B (zh) | 业务场景测试用例的生成方法、装置、设备和存储介质 | |
CN108536362B (zh) | 用于识别操作的方法、装置及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |