CN111210817A - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN111210817A CN111210817A CN201911397953.5A CN201911397953A CN111210817A CN 111210817 A CN111210817 A CN 111210817A CN 201911397953 A CN201911397953 A CN 201911397953A CN 111210817 A CN111210817 A CN 111210817A
- Authority
- CN
- China
- Prior art keywords
- voice
- data processing
- recognition result
- awakening
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000009467 reduction Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请适用于数据处理技术领域,提供了数据处理方法,所述数据处理方法应用于终端设备,所述数据处理方法包括:接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音;在预设时段内检测语音,获取所述语音对应的识别结果。通过上述方法,能提高语音对应的识别结果的获取效率。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及数据处理方法及装置。
背景技术
目前,在测试终端设备的语音处理功能过程中,通常需要根据终端设备所获取到的识别结果确定测试结果。而终端设备获取识别结果的过程一般为:测试人员先找到用于唤醒终端设备的物理按键,将其按下以唤醒终端设备,在终端设备被唤醒之后,终端设备录制语音。由于此过程较为繁琐,因此,语音对应的识别结果的获取效率较低。
发明内容
本申请实施例提供了数据处理方法及装置,可以解决目前的语音对应的识别结果的获取效率较低的问题。
第一方面,本申请实施例提供了一种数据处理方法,所述数据处理方法应用于终端设备,包括:
接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音;
在预设时段内检测语音,获取所述语音对应的识别结果。
在第一方面的第一种可能的实现方式中,在所述接收指定软件发送的唤醒指令之前,包括:
若接收到语音处理功能对应的测试启动指令,则触发指定软件每隔预设时间长度发送唤醒指令至所述终端设备。
在第一方面的第二种可能的实现方式中,在所述获取所述语音对应的识别结果之后,包括:
根据所述识别结果生成日志。
基于本申请第一方面的第二种可能的实现方式,在第三种可能的实现方式中,在所述根据所述识别结果生成日志之后,包括:
若接收到日志获取指令,则将所述日志发送至指定的设备。
在第一方面的第四种可能的实现方式中,在所述获取所述语音对应的识别结果之后,包括:
根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据。
在第一方面的第五种可能的实现方式中,所述获取所述语音对应的识别结果,包括:
对所述语音进行降噪处理;
获取降噪处理后的语音对应的识别结果。
在第一方面的第五种可能的实现方式中,在第六种可能的实现方式中,所述获取降噪处理后的语音对应的识别结果,包括:
将降噪处理后的语音上传至目标服务器,所述目标服务器用于对所述降噪处理后的语音进行识别;
获取所述目标服务器所反馈的识别结果。
第二方面,本申请实施例提供了一种数据处理装置,所述数据处理装置应用于终端设备,所述数据处理装置包括:
状态进入单元,用于接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音;
结果获取单元,用于在预设时段内检测语音,获取所述语音对应的识别结果。
第三方面,本申请实施例提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述数据处理方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述数据处理方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述数据处理方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:由于终端设备在接收到指定软件发送的唤醒指令后,自动进入唤醒状态,即不需要用户先找到用于唤醒该终端设备的物理按键,更不需要用户按压该物理按键以唤醒该终端设备,因此,大大简化了唤醒终端设备的步骤,从而提高了语音对应的识别结果的获取效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的数据处理方法的流程示意图;
图2是本申请另一实施例提供的数据处理方法的流程示意图;
图3是本申请实施例提供的一种数据处理装置的结构示意图;
图4是本申请实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
实施例一:
图1示出了本申请实施例提供的第一种数据处理方法的流程示意图,所述数据处理方法应用于终端设备,详述如下:
作为示例而非限定的是,所述终端设备可为按键型智能语音终端设备。
步骤S101,接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音。
其中,所述唤醒指令用于指示终端设备从休眠状态切换至唤醒状态。
具体地,接收指定软件发送的唤醒指令,检测所述终端设备当前所处的状态,若所述终端设备当前所处的状态为休眠状态,则从休眠状态切换至唤醒状态。
作为示例而非限定的是,假设唤醒指令为1,则在终端设备接收到指定软件发送的1后,检测所述终端设备当前所处的状态,若所述终端设备当前所处的状态为休眠状态,则从休眠状态切换至唤醒状态。
可选地,所述数据处理方法还包括:在所述检测所述终端设备当前所处的状态之后,包括:若所述终端设备当前所处的状态为唤醒状态,则忽略所述唤醒指令,以避免终端设备重新进入唤醒指令,提高终端设备的工作效率。
在一些实施例中,由于可能会出现指定软件误发送指令的情况,因此,为了避免终端设备在接收到指定软件误发送的唤醒指令后进入唤醒状态,则在所述接收指定软件发送的唤醒指令之后,发送询问指令至所述指定软件,所述询问指令用于询问指定软件是否确认要进入唤醒状态,若接收到所述指定软件反馈的确认唤醒信息,则进入唤醒状态,以此提高终端设备的可靠性。
步骤S102,在预设时段内检测语音,获取所述语音对应的识别结果。
其中,所述预设时段为预设的用于检测语音的时间长度。
作为示例而非限定的是,所述预设时段为2秒,对应地,所述步骤S102为在2秒内检测语音,获取所述语音对应的识别结果。
具体地,所述步骤S102包括:进入唤醒状态之后,在预设时段内检测语音,录制所述语音,获取所述语音对应的识别结果。
在一些实施例中,由于在实际环境中可能会出现短暂杂音,因此,为了避免其对语音对应的识别结果的获取过程造成干扰,在所述录制所述语音之后,包括:确定所述语音的长度,对应地,所述获取所述语音对应的识别结果,包括:若所述语音的长度大于或者等于预设语音长度,则获取所述语音的识别结果。
在一些实施例中,为了避免短暂杂音浪费存储空间,因此,在所述确定所述语音的长度之后,包括:若所述语音的长度小于所述预设语音长度,则删除所述录音。
可选地,为了实现语音处理功能的自动化测试,例如实现语音识别自动化测试,以提高处于产品研发阶段的终端设备对应的语音识别性能测试效率,因此,在所述接收指定软件发送的唤醒指令之前,包括:若接收到语音处理功能对应的测试启动指令,则触发指定软件每隔预设时间长度发送唤醒指令至所述终端设备。由于指定软件每隔预设时间长度能够发送唤醒指令至所述终端设备,使得所述终端设备能多次自动进入唤醒状态,不需要用户重复按压物理按键以唤醒该终端设备,因此,大大简化了多次唤醒终端设备的步骤,从而提高了多个识别结果的获取效率,实现了语音处理功能的自动化测试。
具体地,若接收到语音处理功能对应的测试启动指令,则生成软件触发指令,根据所述软件触发指令触发指定软件每隔预设时间长度发送唤醒指令至所述终端设备,语音播放装置每隔所述预设时间长度播放语音,使得所述终端设备能够每隔所述预设时间长度执行所述步骤S101,每执行完所述步骤S101之后执行所述步骤S102,直至接收到所述语音处理功能对应的测试停止指令。若所述步骤S101对应的执行时间长度和所述步骤S102对应的执行时间长度之和大于所述预设时间长度,则会可能出现以下情况:当语音播放装置开始播放下一段语音时,终端设备还在处理上一段语音,无法及时对下一段语音进行处理,使得多个识别结果的获取过程较为混乱,因此,为了能够有序地获取多个识别结果,所述步骤S101对应的执行时间长度和所述步骤S102对应的执行时间长度之和小于或者等于所述预设时间长度,所述步骤S101对应的执行时间长度或/和所述步骤S101对应的执行时间长度可由用户设定。
在一些实施例中,为了节省设置时间长度所花费的时间,因此,所述预设时间长度可仅对应唯一的一个值。
在一些实施例中,由于语音播放装置每次所播放的语音对应的播放时间长度可能不完全相同,为了使得所述终端设备有足够的时间处理语音,因此,所述预设时间长度可对应多个不完全相同的值。
本申请实施例中,由于终端设备在接收到指定软件发送的唤醒指令后,自动进入唤醒状态,即不需要用户先找到用于唤醒该终端设备的物理按键,更不需要用户按压该物理按键以唤醒该终端设备,因此,大大简化了唤醒终端设备的步骤,从而提高了语音对应的识别结果的获取效率。
实施例二:
图2示出了本申请实施例提供的第二种数据处理方法的流程示意图,所述数据处理方法应用于终端设备,本实施例的步骤S201、S202与实施例一的步骤S101、S102相同,此处不再赘述:
步骤S201,接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音。
步骤S202,在预设时段内检测语音,获取所述语音对应的识别结果。
可选地,由于真实环境中存在噪音,因此,为了减少噪音对所述识别结果的干扰,所述获取所述语音对应的识别结果,包括:对所述语音进行降噪处理;获取降噪处理后的语音对应的识别结果。
其中,所述对所述语音进行降噪处理具体包括:根据预设语音降噪方法对所述语音进行降噪处理。
作为示例而非限定的是,所述预设语音降噪方法可为以下任意一种:谱减法、小波变换法、维纳滤波法。
可选地,所述预设语音降噪方法还可具体为:对所述语音进行分帧、根据预设窗函数对分帧后的语音加窗,通过FFT快速傅里叶变换计算出加窗后的语音对应的频域信号,估计所述频域信号对应的频谱平坦度,去除频谱平坦度大于预设频谱平坦度阈值的频域信号,由于噪声的频谱平坦度一般比较大,因此,去除频谱平坦度大于预设频谱平坦度阈值的频域信号,即能有效地实现降噪。
可选地,所述获取降噪处理后的语音对应的识别结果,包括:将降噪处理后的语音上传至目标服务器,所述目标服务器用于对所述降噪处理后的语音进行识别;获取所述目标服务器所反馈的识别结果。
具体地,将降噪处理后的语音打包后上传至指定网际互连协议(InternetProtocol,IP)地址对应的目标服务器,获取所述目标服务器所反馈的识别结果,将降噪处理后的语音的识别工作交由目标服务器处理,能够使得所述终端设备去处理其他事务,以提高终端设备的事务处理效率。
可选地,为了便于测试人员对所述识别结果进行分析,因此,在所述获取所述语音对应的识别结果之后,包括:根据所述识别结果生成日志。
具体地,确定所述识别结果对应的生成时间,根据所述识别结果的内容和所述生成时间生成日志。
可选地,所述根据所述识别结果生成日志包括:根据所述识别结果和指定关键字生成日志,其中,指定关键字用于作为识别结果的标识,便于查找识别结果。
可选地,为了便于测试人员获取日志,因此,在所述根据所述识别结果生成日志之后,包括:若接收到日志获取指令,则将所述日志发送至指定的设备。
具体地,若接收到日志获取指令,则解析所述日志获取指令,根据所述日志获取指令对应的解析结果将所述日志发送至指定的设备。
步骤S203,根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据。
具体地,所述步骤S203包括:将所述识别结果和所述语音对应的原始语料进行比对,根据比对结果确定语音识别效果数据。
作为示例而非限定的是,所述语音识别效果数据可为:字错率或/和句准率。所述字错率为识别错误的字的数量除以识别结果对应的总字数所得到的商,所述句准率为识别完全正确的句子的数量除以识别结果对应的总句数所得到的商。
本申请实施例中,由于能够根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据,且语音识别效果数据能够明显地体现出语音识别效果,因此,有助于测试人员对其进行了解。
实施例三:
与上述实施例二对应,图3示出了本申请实施例提供的一种数据处理装置的结构示意图,所述数据处理装置应用于终端设备,为了便于说明,仅示出了与本申请实施例相关的部分。
作为示例而非限定的是,所述终端设备为按键型智能语音终端设备。
该数据处理装置包括:状态进入单元301和结果获取单元302。
所述状态进入单元301,用于接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音。
其中,所述唤醒指令用于指示终端设备从休眠状态切换至唤醒状态。
所述状态进入单元301,具体用于:接收指定软件发送的唤醒指令,检测所述终端设备当前所处的状态,若所述终端设备当前所处的状态为休眠状态,则从休眠状态切换至唤醒状态。
可选地,该数据处理装置还包括:指令忽略单元。
所述指令忽略单元用于:在所述状态进入单元301执行所述检测所述终端设备当前所处的状态之后,若所述终端设备当前所处的状态为唤醒状态,则忽略所述唤醒指令,以避免终端设备重新进入唤醒指令,提高终端设备的工作效率。
可选地,由于可能会出现指定软件误发送指令的情况,因此,为了避免终端设备在接收到指定软件误发送的唤醒指令后进入唤醒状态,所述状态进入单元301用于:接收指定软件发送的唤醒指令,发送询问指令至所述指定软件,所述询问指令用于询问指定软件是否确认要进入唤醒状态,若接收到所述指定软件反馈的确认唤醒信息,则进入唤醒状态,以此提高终端设备的可靠性。
所述结果获取单元302,用于在预设时段内检测语音,获取所述语音对应的识别结果。
所述结果获取单元302,具体用于:在预设时段内检测语音,录制所述语音,获取所述语音对应的识别结果。
在一些实施例中,由于在实际环境中可能会出现短暂杂音,因此,为了避免其对语音对应的识别结果的获取过程造成干扰,该数据处理装置还包括:长度确定单元。
所述长度确定单元用于:在所述结果获取单元302录制所述语音之后,确定所述语音的长度,对应地,所述结果获取单元302在执行所述获取所述语音对应的识别结果时,具体用于:若所述语音的长度大于或者等于预设语音长度,则获取所述语音的识别结果。
在一些实施例中,为了避免短暂杂音浪费存储空间,因此,该数据处理装置还包括:录音删除单元。
所述录音删除单元用于:在所述长度确定单元执行所述确定所述语音的长度之后,若所述语音的长度小于所述预设语音长度,则删除所述录音。
可选地,由于真实环境中存在噪音,因此,为了减少噪音对所述识别结果的干扰,所述结果获取单元302在执行所述获取所述语音对应的识别结果时,具体用于:对所述语音进行降噪处理;获取降噪处理后的语音对应的识别结果。
可选地,为了便于测试人员对所述识别结果进行分析,因此,该数据处理装置还包括:日志生成单元。
所述日志生成单元用于:在所述结果获取单元302执行所述获取所述语音对应的识别结果之后,根据所述识别结果生成日志。
可选地,为了便于测试人员获取日志,因此,该数据处理装置还包括:日志发送单元。
所述日志发送单元用于:在所述日志生成单元执行所述根据所述识别结果生成日志之后,若接收到日志获取指令,则将所述日志发送至指定的设备。
可选地,该数据处理装置还包括:触发单元。
所述触发单元用于:在所述状态进入单元301执行所述接收指定软件发送的唤醒指令之前,若接收到语音处理功能对应的测试启动指令,则触发指定软件每隔预设时间长度发送唤醒指令至所述终端设备。由于指定软件每隔预设时间长度能够发送唤醒指令至所述终端设备,使得所述终端设备能多次自动进入唤醒状态,不需要用户重复按压物理按键以唤醒该终端设备,因此,大大简化了多次唤醒终端设备的步骤,从而提高了多个识别结果的获取效率。
可选地,该数据处理装置还包括:数据确定单元。
所述数据确定单元用于:在所述结果获取单元302执行所述获取所述语音对应的识别结果之后,根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据。由于能够根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据,且语音识别效果数据能够明显地体现出语音识别效果,因此,有助于测试人员对其进行了解。
本申请实施例中,由于终端设备在接收到指定软件发送的唤醒指令后,自动进入唤醒状态,即不需要用户先找到用于唤醒该终端设备的物理按键,更不需要用户按压该物理按键以唤醒该终端设备,因此,大大简化了唤醒终端设备的步骤,从而提高了语音对应的识别结果的获取效率。
实施例四:
图4为本申请一实施例提供的终端设备的结构示意图。如图4所示,该实施例的终端设备4包括:至少一个处理器40(图4中仅示出一个)处理器、存储器41以及存储在所述存储器41中并可在所述至少一个处理器40上运行的计算机程序42,所述处理器40执行所述计算机程序42时实现上述任意各个数据处理方法实施例中的步骤。
所述终端设备4可以是按键型智能语音终端设备、桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的举例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),该处理器40还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41在一些实施例中可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41在另一些实施例中也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的网络设备和方法,可以通过其它的方式实现。例如,以上所描述的网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,所述数据处理方法应用于终端设备,所述数据处理方法包括:
接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音;
在预设时段内检测语音,获取所述语音对应的识别结果。
2.如权利要求1所述的数据处理方法,其特征在于,在所述接收指定软件发送的唤醒指令之前,包括:
若接收到语音处理功能对应的测试启动指令,则触发指定软件每隔预设时间长度发送唤醒指令至所述终端设备。
3.如权利要求1所述的数据处理方法,其特征在于,在所述获取所述语音对应的识别结果之后,包括:
根据所述识别结果生成日志。
4.如权利要求3所述的数据处理方法,其特征在于,在所述根据所述识别结果生成日志之后,包括:
若接收到日志获取指令,则将所述日志发送至指定的设备。
5.如权利要求1所述的数据处理方法,其特征在于,在所述获取所述语音对应的识别结果之后,包括:
根据所述识别结果和所述语音对应的原始语料确定语音识别效果数据。
6.如权利要求1所述的数据处理方法,其特征在于,所述获取所述语音对应的识别结果,包括:
对所述语音进行降噪处理;
获取降噪处理后的语音对应的识别结果。
7.如权利要求6所述的数据处理方法,其特征在于,所述获取降噪处理后的语音对应的识别结果,包括:
将降噪处理后的语音上传至目标服务器,所述目标服务器用于对所述降噪处理后的语音进行识别;
获取所述目标服务器所反馈的识别结果。
8.一种数据处理装置,其特征在于,所述数据处理装置应用于终端设备,所述数据处理装置包括:
状态进入单元,用于接收指定软件发送的唤醒指令,进入唤醒状态,进入唤醒状态的终端设备能够实时检测语音;
结果获取单元,用于在预设时间段内检测语音,获取所述语音对应的识别结果。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911397953.5A CN111210817B (zh) | 2019-12-30 | 2019-12-30 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911397953.5A CN111210817B (zh) | 2019-12-30 | 2019-12-30 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111210817A true CN111210817A (zh) | 2020-05-29 |
CN111210817B CN111210817B (zh) | 2023-06-13 |
Family
ID=70787908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911397953.5A Active CN111210817B (zh) | 2019-12-30 | 2019-12-30 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111210817B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111880988A (zh) * | 2020-07-09 | 2020-11-03 | Oppo广东移动通信有限公司 | 一种声纹唤醒日志收集方法及装置 |
CN111933137A (zh) * | 2020-08-19 | 2020-11-13 | Oppo广东移动通信有限公司 | 语音唤醒测试方法及装置、计算机可读介质和电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102736536A (zh) * | 2012-07-13 | 2012-10-17 | 海尔集团公司 | 语音控制电器设备的方法、装置 |
CN103186231A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音鼠标装置 |
EP2727873A1 (en) * | 2012-11-05 | 2014-05-07 | Orona, S. Coop. | Testing method and installation for testing remote alarm systems in elevators |
CN104517606A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 语音识别测试方法及装置 |
CN104599669A (zh) * | 2014-12-31 | 2015-05-06 | 乐视致新电子科技(天津)有限公司 | 一种语音控制方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN109189365A (zh) * | 2018-08-17 | 2019-01-11 | 平安普惠企业管理有限公司 | 一种语音识别方法、存储介质和终端设备 |
CN109243425A (zh) * | 2018-08-13 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 语音识别测试方法、装置、系统、计算机设备及存储介质 |
CN109616135A (zh) * | 2018-11-14 | 2019-04-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、装置及存储介质 |
CN109801646A (zh) * | 2019-01-31 | 2019-05-24 | 北京嘉楠捷思信息技术有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
KR20190065200A (ko) * | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
CN109979478A (zh) * | 2019-04-08 | 2019-07-05 | 网易(杭州)网络有限公司 | 语音降噪方法及装置、存储介质及电子设备 |
-
2019
- 2019-12-30 CN CN201911397953.5A patent/CN111210817B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186231A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音鼠标装置 |
CN102736536A (zh) * | 2012-07-13 | 2012-10-17 | 海尔集团公司 | 语音控制电器设备的方法、装置 |
EP2727873A1 (en) * | 2012-11-05 | 2014-05-07 | Orona, S. Coop. | Testing method and installation for testing remote alarm systems in elevators |
CN104517606A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 语音识别测试方法及装置 |
CN104599669A (zh) * | 2014-12-31 | 2015-05-06 | 乐视致新电子科技(天津)有限公司 | 一种语音控制方法和装置 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN109243425A (zh) * | 2018-08-13 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 语音识别测试方法、装置、系统、计算机设备及存储介质 |
CN109189365A (zh) * | 2018-08-17 | 2019-01-11 | 平安普惠企业管理有限公司 | 一种语音识别方法、存储介质和终端设备 |
CN109616135A (zh) * | 2018-11-14 | 2019-04-12 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、装置及存储介质 |
CN109801646A (zh) * | 2019-01-31 | 2019-05-24 | 北京嘉楠捷思信息技术有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
CN109979478A (zh) * | 2019-04-08 | 2019-07-05 | 网易(杭州)网络有限公司 | 语音降噪方法及装置、存储介质及电子设备 |
KR20190065200A (ko) * | 2019-05-21 | 2019-06-11 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
Non-Patent Citations (3)
Title |
---|
SONJA A. KOTZ: "Cortical speech processing unplugged: a timely subcortico-cortical framework" * |
王方杰: "基于会议电话中的实时语音降噪算法研究", 《电子器件》 * |
陈晓仕: "语音触发SOC芯片的软硬件协同设计及低延时方案" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111880988A (zh) * | 2020-07-09 | 2020-11-03 | Oppo广东移动通信有限公司 | 一种声纹唤醒日志收集方法及装置 |
CN111880988B (zh) * | 2020-07-09 | 2022-11-04 | Oppo广东移动通信有限公司 | 一种声纹唤醒日志收集方法及装置 |
CN111933137A (zh) * | 2020-08-19 | 2020-11-13 | Oppo广东移动通信有限公司 | 语音唤醒测试方法及装置、计算机可读介质和电子设备 |
CN111933137B (zh) * | 2020-08-19 | 2024-04-16 | Oppo广东移动通信有限公司 | 语音唤醒测试方法及装置、计算机可读介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111210817B (zh) | 2023-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069608B (zh) | 一种语音交互的方法、装置、设备和计算机存储介质 | |
US9612791B2 (en) | Method, system and storage medium for monitoring audio streaming media | |
CN107526826B (zh) | 语音搜索处理方法、装置及服务器 | |
CN109669663B (zh) | 音区幅值获取方法、装置、电子设备及存储介质 | |
CN101923432A (zh) | 一种移动终端中应用程序的调用方法及装置 | |
CN110875059B (zh) | 收音结束的判断方法、装置以及储存装置 | |
CN111370022B (zh) | 音频广告检测方法、装置、电子设备及介质 | |
US10803861B2 (en) | Method and apparatus for identifying information | |
CN111210817B (zh) | 数据处理方法及装置 | |
US10950221B2 (en) | Keyword confirmation method and apparatus | |
WO2023197955A1 (zh) | 信号处理方法、装置、电子设备及介质 | |
CN108319688B (zh) | 一种用于对用户进行阅读提醒的方法与设备 | |
CN110990365A (zh) | 一种数据同步方法、装置、服务器及存储介质 | |
CN113381963A (zh) | 一种域名检测方法、装置和存储介质 | |
CN110688558B (zh) | 网页搜索的方法、装置、电子设备和存储介质 | |
CN109343985B (zh) | 一种数据处理方法、装置及存储介质 | |
CN111261157A (zh) | 一种短视频的控制方法、装置、设备及存储介质 | |
CN110598199B (zh) | 数据流式处理方法、装置、计算机设备和存储介质 | |
CN115809267A (zh) | 一种用于生成审计结果的方法、设备、介质及程序产品 | |
CN112542168B (zh) | 语音控制方法及装置 | |
CN114121042A (zh) | 免唤醒场景下的语音检测方法、装置及电子设备 | |
CN109871463B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN112598027A (zh) | 一种设备的异常识别方法、装置、终端设备及存储介质 | |
CN115691497B (zh) | 一种语音控制方法、装置、设备及介质 | |
CN116665660A (zh) | 车载音频识别方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240903 Address after: No. 60, Guohe Road, Yangpu District, Shanghai 200082 Patentee after: Shanghai youbijie Education Technology Co.,Ltd. Country or region after: China Address before: 518000 16th and 22nd Floors, C1 Building, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Patentee before: Shenzhen UBTECH Technology Co.,Ltd. Country or region before: China |