CN110096612A - 语音日志的在线音频分析数据的获取方法及系统 - Google Patents

语音日志的在线音频分析数据的获取方法及系统 Download PDF

Info

Publication number
CN110096612A
CN110096612A CN201910371304.1A CN201910371304A CN110096612A CN 110096612 A CN110096612 A CN 110096612A CN 201910371304 A CN201910371304 A CN 201910371304A CN 110096612 A CN110096612 A CN 110096612A
Authority
CN
China
Prior art keywords
audio
present video
present
file
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910371304.1A
Other languages
English (en)
Inventor
徐香君
肖通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201910371304.1A priority Critical patent/CN110096612A/zh
Publication of CN110096612A publication Critical patent/CN110096612A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种语音日志的在线音频分析数据的获取方法及系统,方法包括:根据当前语音日志信息调用与其对应的当前音频采集文件。根据当前音频采集文件生成当前音频波形图和当前音频频谱图。根据设定分析参数从当前音频波形图和当前音频频谱图中提取当前分析参数。将当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。本申请可通过语音日志对其对应音频进行在服务器端的调用。调用速度快。并可预设特征值对其获取的音频特征在音频分析图上进行快速调整。提高了音频处理效率及一致性,适合快速、批量的音频处理。

Description

语音日志的在线音频分析数据的获取方法及系统
技术领域
本发明属于音频信息处理技术领域,尤其涉及语音日志的在线音频分析数据的获取方法及系统。
背景技术
目前,还尚未见一种成熟的基于语音日志的在线音频分析工具。受制于公司业务,市面上呈现较多的日志查询分析工具基本都是除语音之外的常规操作日志,音频分析也基本都是以客户端形式存在的音频分析软件,而基于语音日志的web端音频分析几乎没有。
现有技术中的方法要实现音频分析,少不了波形图和频谱图的加载和渲染。但是要基于web端来实现,则存在一定的难度。同时,音频图加载出来后还要给出参考值及分析结论。如果能与语音日志的查询和分析相结合,查看日志的同时,分析音频的存在问题,更是能避免下载又导入的繁琐流程。
上述现有技术的缺陷是,使用客户端形式的音频分析软件,需要先从原始日志中下载音频,再把音频导入到音频分析软件中,手动调节参数,查看波形图和频谱图。除了专业的音频分析人员,不具备基础音频分析知识的人无法仅从两张图中获取音频的问题,这些软件均无法给用户提供最直观最基础的音频分析结论。上述缺陷主要是公司业务不涉及语音技术和算法,不关注音频波形图的峰值、频谱饱满度、音频缺失等方面的问题,web端的频谱图在前端技术层面也较难实现。
本行业中,要解决以上的缺陷,一般是交由专业的音频分析人员来操作,通常使用的也就是市面上较多的Audacity这类的客户端软件,由专业人员分析后给出分析结果供其他部分使用。但是这样的流程较长,先要下载音频,然后导入到软件中,再调参、观察、分析,最后给出结论。主要原因是语音行业是有行业门槛的,市面上做语音的本来没几家,能将在线音频分析与日志查询分析的流程串联打通的很少。
现有技术中基于现有的语音日志查询平台,将日志查询与音频分析相结合。即用户在查询某条日志的时候,可以获取音频信息,并在线加载波形图和频谱图,分析音频的质量。这样方便用户一边查看日志一边检测音频,减少了问题定位的流程和步骤。仅提供波形图和频谱图的加载,对于音频分析而言,还是远远不够的。关键参数的读取,以及合理的参考标准也是必要的。我们面向的用户大多不是专业的音频分析人员,他们对音频的分析专业度是不够的,能自动读取出关键的参数,提供合理参数以供对比参照,是很有必要的。最后再根据实际参数与标准参数的对比,给出参考建议,就非常人性化了。
由此可知,现有技术中的音频分析多是在客户端处理、完成的。用户需要根据语音日志信息,在远端或Web端调用相应的音频文件,然后在客户端本地加载后再进行音频分析。而在音频分析的过程中,因为用户缺乏专业人员的调音基础,因此无法对音频进行适合的调节。从而限制了音频的后期加工及运用,降低了音频的合成质量并局限了后期应用。
发明内容
本发明实施例提供一种语音日志的在线音频分析数据的获取方法及系统,用于至少解决上述技术问题之一。
第一方面,语音日志的在线音频分析数据的获取方法,包括:
步骤S101,根据当前语音日志信息调用与其对应的当前音频采集文件;
步骤S102,根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
步骤S103,根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
步骤S104,将所述当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
在本发明一种优选的实施方式中,所述步骤S101前还包括:
步骤S100,根据采集到的多个音频文件生成多条语音日志信息记录,将所述多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系;
所述步骤S101包括:根据当前语音日志信息调用所述日志音频对应关系,获取对应的当前音频采集文件。
在本发明一种优选的实施方式中,所述多条语音日志信息记录中的每一条语音日志信息记录中包括:语音日志信息包括音频URL地址、音频格式、音频采样点大小、音频采样率、音频时长、声道信息。
在本发明一种优选的实施方式中,所述步骤S101中包括:
步骤S101a,若所述当前音频采集文件的文件字节数为空,则重新对当前音频采集文件进行调用。
在本发明一种优选的实施方式中,所述步骤S102中包括:
S102a,若所述当前音频频谱图中的噪点数据大于设定值,则重新返回步骤S101再次对当前音频采集文件调用,或
S102b,若所述当前音频波形图与预设音频波形图的图形覆盖匹配度和/或所述当前音频频谱图与预设音频频谱图的图形覆盖匹配度小于设定值,则重新根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图。
在本发明一种优选的实施方式中,所述设定分析参数包括:峰值的远场幅度、峰值的进场幅度、波形图的断开线数量或频谱图的断开图形数量、频谱分布值;
所述S103中包括:S103a,从所述当前音频波形图中获取当前波形图的断开线数量;从所述当前音频频谱图中获取当前频谱图的断开图形数量;所述步骤S104中包括:S104a,若当前波形图的断开线数量或所述当前频谱图的断开图形数量超过设定数量则在所述在线音频分析数据中生成间断提示信息,所述间断提示信息中包括所述当前波形图的断开线数量信息,和/或当前频谱图的断开图形数量信息。
在本发明一种优选的实施方式中,所述步骤S104中还包括:
S104b,将所述当前分析参数与设定分析参数逐项进行比对获取差异值,根据所述差异值确定在线音频分析数据;所述步骤S104后还包括:步骤S105,若所述差异值超过设定差异值则根据所述设定分析参数对所述当前音频采集文件进行调整。
第二方面,本发明实施例提供语音日志的在线音频分析数据的获取系统,包括:当前音频采集文件获取单元、音频图获取单元、当前分析参数获取单元及在线音频分析数据获取单元,其中:
所述当前音频采集文件获取单元,配置为根据当前语音日志信息调用与其对应的当前音频采集文件;
所述音频图获取单元,配置为根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
所述当前分析参数获取单元,配置为根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
所述在线音频分析数据获取单元,配置为将所述当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
在本发明一种优选的实施方式中,还包括建立关系单元,
所述建立关系单元,配置为根据采集到的多个音频文件生成多条语音日志信息记录,将所述多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系。
所述当前音频采集文件获取单元,还配置为根据当前语音日志信息调用所述日志音频对应关系,获取对应的当前音频采集文件。
在本发明一种优选的实施方式中,还包括调整单元:
所述在线音频分析数据获取单元,还配置为将所述当前分析参数与设定分析参数逐项进行比对获取差异值,根据所述差异值确定在线音频分析数据;所述调整单元,配置为若所述差异值超过设定差异值则根据所述设定分析参数对所述当前音频采集文件进行调整。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的方法的步骤。
第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的方法的步骤。
本申请的语音日志的在线音频分析数据的获取方法,可通过语音日志对其对应音频进行在服务器端的调用。调用速度快。在服务器端进行音频分析图形,即音频波形图和音频频谱图的加载,可快速获取音频的基本信息。并可根据预设特征值对其获取的音频特征在音频分析图上进行快速调整。提高了音频处理效率及一致性,适合快速、批量的音频处理。从而本发明,能直接达到的效果就是帮助用户在获取日志的同时,便捷地了解音频质量,快速定位问题,即使是非专业人员,也能直接获取到音频的基础结论,极大地提高了工作效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施方式提供的一种语音日志的在线音频分析数据的获取方法的流程图。
图2为本发明一实施方式提供具有建立日志音频对应关系步骤的获取方法的流程图。
图3为本发明一实施方式提供的另一种语音日志的在线音频分析数据的获取方法中步骤S101的流程图。
图4为本发明一实施方式提供的另一种语音日志的在线音频分析数据的获取方法中步骤S102的流程图。
图5为本发明一实施方式提供的另一种语音日志的在线音频分析数据的获取方法中步骤S103及S104的流程图。
图6为本发明一实施方式提供的又一种语音日志的在线音频分析数据的获取方法的流程图。
图7为本发明一实施例提供的一种语音日志的在线音频分析数据的获取系统的组成示意图。
图8为本发明一实施例提供的另一种语音日志的在线音频分析数据的获取系统的组成示意图。
图9为本发明一实施例提供的再一种语音日志的在线音频分析数据的获取系统的组成示意图。
图10是本发明一实施例提供的电子设备的结构示意图。
图11为本发明一实施方式提供的再一种语音日志的在线音频分析数据的获取方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种实施方式中,如图1所示,公开了一种语音日志的在线音频分析数据的获取方法,包括:
步骤S101,调用当前音频采集文件。
本步骤中,根据当前语音日志信息调用与其对应的当前音频采集文件。用户打开具有多条语音日志的用户界面,该用户界面可以是通过网页展现的,也可以通过App应用界面给予显示。用户从上述用户界面的多条语音日志中选取(点击)一条或多条当前语音日志信息。在服务器端,即Web端,服务器在接收到用户选取的“当前语音日志信息”后,根据信息中的URL地址。统一资源定位符(Uniform Resource Locator)"简称为URL。对本地预存的视频或通过数据库形式存储的视频进行调用,视频文件的文件信息中包括上述URL地址。从而实现“当前音频采集文件”的调用。
步骤S102,获取音频波形图及音频频谱图。
本步骤中,根据当前音频采集文件生成当前音频波形图和当前音频频谱图。在服务器端,根据步骤S101中获取的“当前音频采集文件”生成该音频的音频波形图及音频频谱图。
步骤S103,提取当前分析参数。
本步骤中,根据设定分析参数从当前音频波形图和当前音频频谱图中提取当前分析参数。上述设定分析参数包括:峰值的远场幅度、峰值的进场幅度、波形图的断开线数量或频谱图的断开图形数量、频谱分布值。“设定分析参数”是用户希望进行设定或查找的设定分析参数,是音频波形图及音频频谱图参数的一部分。
步骤S104,获取音频分析数据。
本步骤中,将当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。将从步骤S103中提取的当前分析参数与设定的参数比较,得到分析比较的数据,即当前音频采集文件的在线音频分析数据。在该数据中能够包括当前音频采集文件的当前分析参数。在进行参数判断时:上述峰值优选为远场幅度0.05,近场幅度0.1。频谱频谱分布通常在0-8K之间,3k左右最饱满。
如图11所示,在本发明的另一种实施方式中,
第一步,登录日志查询平台,输入检索条件,检索出相关日志和音频;
第二步,用户定位问题,查看某条问题日志,在线播放音频;
第三步,播放的音频有异常,或者与语音识别的文本不一致,可加载波形图和频谱图。可以对音频图进行缩放细查、选中播放等操作,但大多数用户可能对音频图一无所知,无法从中获取关键信息,此时系统自动读取出关键参数,如波形图峰值、频谱饱满度、录音残缺情况等,并给出合理的参考结论。
目前已经实现了在日志查询平台中进行音频的在线解析,主要是指音频的波形图和频谱图的展示,减少了音频导入软件的流程步骤,可以更方便地结合日志分析音频。缺点在于对音频关键参数的分析,以及音频分析的参考结论,目前还在开发中。
从而本发明,能直接达到的效果就是帮助用户在获取日志的同时,便捷地了解音频质量,快速定位问题,即使是非专业人员,也能直接获取到音频的基础结论,极大地提高了工作效率。
本发明是基于web端的音频分析,包括波形图和频谱图的加载,和基于两张图给出的基础音频分析。目前市面上能见到的,都是基于客户端实现的音频加载,而是基于web端的,这就是最大的不同。同时,本发明是直接从日志中获取到的音频,进行在线分析。现有客户端的音频分析,需要先下载到本地,再导入到软件中进行分析。的更加方便,同时减少了中间流程可能带来的数据丢失情况。
本发明的另一种实施方式中,如图2所示,在步骤S101前还包括:
步骤S100,建立日志音频对应关系。
在本步骤中,根据采集到的多个音频文件生成多条语音日志信息记录,将多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系。上述多条语音日志信息记录中的每一条语音日志信息记录中包括:语音日志信息包括音频URL地址、音频格式、音频采样点大小、音频采样率、音频时长、声道信息。上述多条语音日志信息记录中的每一条语音日志信息可以通过界面进行显示,一方面便于用户对多条语音日志信息记录进行选取,另外便于基于上述信息进行检索,从而使日志音频的获取更为准确。
步骤S101中包括,根据当前语音日志信息调用日志音频对应关系,获取对应的当前音频采集文件。
本发明的又一种实施方式中,如图3所示,在步骤S101中包括:
步骤S101a,重新调用当前音频采集文件。
在本步骤中,若当前音频采集文件的文件字节数为空,则重新对当前音频采集文件进行调用。从而避免因调用文件错误,造成的后续音频分析准确性差、浪费系统运行资源的问题。
本发明的又一种实施方式中,如图4所示,在步骤S102中包括:
S102a,再次对当前音频采集文件调用。
若当前音频频谱图中的噪点数据大于设定值,则重新返回步骤S101再次对当前音频采集文件调用,或从而避免因调用文件错误,噪音多所造成的后续音频分析准确性差、浪费系统运行资源的问题。
S102b,重新生成音频波形图及音频频谱图。
若所述当前音频波形图与预设音频波形图的图形覆盖匹配度和/或所述当前音频频谱图与预设音频频谱图的图形覆盖匹配度小于设定值,则重新根据当前音频采集文件生成当前音频波形图和当前音频频谱图。上述预设音频波形图、预设音频频谱图为当前音频根据“较好”或“理想”的音效所预先检测、调整得出的图。在当前音频为标准且可重复的音频段落时,可高效的进行音频处理。
本发明的再一种实施方式中,如图5所示,S103中包括:
S103a,获取断开图形数量。
在本步骤中,从当前音频波形图中获取当前波形图的断开线数量。从当前音频频谱图中获取当前频谱图的断开图形数量。
步骤S104中包括:
S104a,生成间断提示信息。
在本步骤中,若当前波形图的断开线数量或当前频谱图的断开图形数量超过设定数量则在在线音频分析数据中生成间断提示信息。间断提示信息中包括当前波形图的断开线数量信息,和/或当前频谱图的断开图形数量信息。
通过对当前波形图的断开线数量或当前频谱图的断开图形数量的设定,可以基本设定当前音频的质量或播放连续性。从而可对当前音频的调整或使用给出最快捷的判断。
本发明的又一种实施方式中,如图6所示,步骤S104中还包括:
S104b,确定在线音频分析数据。
在本步骤中,将当前分析参数与设定分析参数逐项进行比对获取差异值,根据差异值确定在线音频分析数据。
步骤S104后还包括:
步骤S105,当前音频采集文件调整。
在本步骤中,若差异值超过设定差异值则根据设定分析参数对当前音频采集文件调整。同时,还可以对设定分析参数在客户端进行显示。
在本发明的一种实施方式中,还公开了语音日志的在线音频分析数据的获取系统,如图7所示,包括:当前音频采集文件获取单元101、音频图获取单元201、当前分析参数获取单元301及在线音频分析数据获取单元401。其中:
当前音频采集文件获取单元101,配置为根据当前语音日志信息调用与其对应的当前音频采集文件。
音频图获取单元201,配置为根据当前音频采集文件生成当前音频波形图和当前音频频谱图。
当前分析参数获取单元301,配置为根据设定分析参数从当前音频波形图和当前音频频谱图中提取当前分析参数。
在线音频分析数据获取单元401,配置为将当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
在本发明语音日志的在线音频分析数据的获取系统的一种实施方式中,如图8所示,还包括建立关系单元100。
建立关系单元100,配置为根据采集到的多个音频文件生成多条语音日志信息记录,将多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系。
当前音频采集文件获取单元101,还配置为根据当前语音日志信息调用日志音频对应关系,获取对应的当前音频采集文件。
在本发明语音日志的在线音频分析数据的获取系统的一种实施方式中,如图9所示,还包括调整单元501。
在线音频分析数据获取单元401,还配置为将当前分析参数与设定分析参数逐项进行比对获取差异值,根据差异值确定在线音频分析数据。
调整单元501,配置为若差异值超过设定差异值则根据设定分析参数对当前音频采集文件进行调整。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的语音信号处理和使用方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机或服务器可执行指令设置为:
步骤S101,根据当前语音日志信息调用与其对应的当前音频采集文件;
步骤S102,根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
步骤S103,根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
步骤S104,将所述当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的语音日志的在线音频分析数据的获取方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的语音日志的在线音频分析数据的获取方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语音信号处理装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至语音信号处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项语音日志的在线音频分析数据的获取方法。
图10是本发明实施例提供的电子设备的结构示意图,如图10所示,该设备包括:一个或多个处理器710以及存储器720,图10中以一个处理器710为例。语音日志的在线音频分析数据的获取方法的设备还可以包括:输入装置730和输出装置740。处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图10中以通过总线连接为例。存储器720为上述的非易失性计算机可读存储介质。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例语音日志的在线音频分析数据的获取方法。输入装置730可接收输入的数字或字符信息,以及产生与信息投放装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备可以应用于智能语音对话平台中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
步骤S101,根据当前语音日志信息调用与其对应的当前音频采集文件;
步骤S102,根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
步骤S103,根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
步骤S104,将所述当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.语音日志的在线音频分析数据的获取方法,包括:
步骤S101,根据当前语音日志信息调用与其对应的当前音频采集文件;
步骤S102,根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
步骤S103,根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
步骤S104,将所述当前分析参数比对所述设定分析参数,获取所述当前音频采集文件的在线音频分析数据。
2.根据权利要求1所述的获取方法,其中,所述步骤S101前还包括:
步骤S100,根据采集到的多个音频文件生成多条语音日志信息记录,将所述多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系;
所述步骤S101包括:根据当前语音日志信息调用所述日志音频对应关系,获取对应的当前音频采集文件。
3.根据权利要求2所述的获取方法,其中,所述多条语音日志信息记录中的每一条语音日志信息记录中包括:音频URL地址、音频格式、音频采样点大小、音频采样率、音频时长、声道信息。
4.根据权利要求1所述的获取方法,其中,所述步骤S101中包括:
步骤S101a,若所述当前音频采集文件的文件字节数为空,则重新对所述当前音频采集文件进行调用。
5.根据权利要求1所述的获取方法,其中,所述步骤S102中包括:
S102a,若所述当前音频频谱图中的噪点数据大于设定值,则重新返回步骤S101再次对所述当前音频采集文件调用,或
S102b,若所述当前音频波形图与预设音频波形图的图形覆盖匹配度和/或所述当前音频频谱图与预设音频频谱图的图形覆盖匹配度小于设定值,则重新根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图。
6.根据权利要求1所述的获取方法,其中,所述设定分析参数包括:峰值的远场幅度、峰值的进场幅度、波形图的断开线数量或频谱图的断开图形数量、频谱分布值;
所述S103中包括:
S103a,从所述当前音频波形图中获取当前波形图的断开线数量;从所述当前音频频谱图中获取当前频谱图的断开图形数量;
所述步骤S104中包括:
S104a,若所述当前波形图的断开线数量或所述当前频谱图的断开图形数量超过设定数量则在所述在线音频分析数据中生成间断提示信息,所述间断提示信息中包括所述当前波形图的断开线数量信息,和/或所述当前频谱图的断开图形数量信息。
7.根据权利要求1所述的获取方法,所述步骤S104中还包括:
S104b,将所述当前分析参数与所述设定分析参数逐项进行比对获取差异值,根据所述差异值确定所述在线音频分析数据;
所述步骤S104后还包括:
步骤S105,若所述差异值超过设定差异值则根据所述设定分析参数对所述当前音频采集文件进行调整。
8.语音日志的在线音频分析数据的获取系统,其特征在于,包括:当前音频采集文件获取单元、音频图获取单元、当前分析参数获取单元及在线音频分析数据获取单元,其中:
所述当前音频采集文件获取单元,配置为根据当前语音日志信息调用与其对应的当前音频采集文件;
所述音频图获取单元,配置为根据所述当前音频采集文件生成当前音频波形图和当前音频频谱图;
所述当前分析参数获取单元,配置为根据设定分析参数从所述当前音频波形图和当前音频频谱图中提取当前分析参数;
所述在线音频分析数据获取单元,配置为将所述当前分析参数比对设定分析参数,获取当前音频采集文件的在线音频分析数据。
9.根据权利要求8所述的获取系统,其特征在于,还包括建立关系单元,
所述建立关系单元,配置为根据采集到的多个音频文件生成多条语音日志信息记录,将所述多条语音日志信息记录及与之对应的多个音频采集文件建立日志音频对应关系。
所述当前音频采集文件获取单元,还配置为根据当前语音日志信息调用所述日志音频对应关系,获取对应的当前音频采集文件。
10.根据权利要求8所述的获取系统,其特征在于,还包括调整单元:
所述在线音频分析数据获取单元,还配置为将所述当前分析参数与设定分析参数逐项进行比对获取差异值,根据所述差异值确定在线音频分析数据;
所述调整单元,配置为若所述差异值超过设定差异值则根据所述设定分析参数对所述当前音频采集文件进行调整。
CN201910371304.1A 2019-05-06 2019-05-06 语音日志的在线音频分析数据的获取方法及系统 Pending CN110096612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371304.1A CN110096612A (zh) 2019-05-06 2019-05-06 语音日志的在线音频分析数据的获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371304.1A CN110096612A (zh) 2019-05-06 2019-05-06 语音日志的在线音频分析数据的获取方法及系统

Publications (1)

Publication Number Publication Date
CN110096612A true CN110096612A (zh) 2019-08-06

Family

ID=67446916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371304.1A Pending CN110096612A (zh) 2019-05-06 2019-05-06 语音日志的在线音频分析数据的获取方法及系统

Country Status (1)

Country Link
CN (1) CN110096612A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112433797A (zh) * 2020-11-23 2021-03-02 苏州思必驰信息科技有限公司 可视化语音信号处理方法及系统
CN113673218A (zh) * 2021-08-20 2021-11-19 北京明略昭辉科技有限公司 音频数据分析方法、系统、存储介质及电子设备
CN116721678A (zh) * 2022-09-29 2023-09-08 荣耀终端有限公司 音频数据的监测方法、电子设备以及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004025403A2 (en) * 2002-09-12 2004-03-25 Mcguire Todd J System and method for visualizing user activity
CN101193009A (zh) * 2006-11-30 2008-06-04 国际商业机器公司 用于对Web事件进行音调监控的方法、系统和程序产品
CN105788611A (zh) * 2016-02-25 2016-07-20 成都普创通信技术股份有限公司 一种音频质量在线监测系统
CN108446370A (zh) * 2018-03-15 2018-08-24 苏州思必驰信息科技有限公司 语音数据统计方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004025403A2 (en) * 2002-09-12 2004-03-25 Mcguire Todd J System and method for visualizing user activity
CN101193009A (zh) * 2006-11-30 2008-06-04 国际商业机器公司 用于对Web事件进行音调监控的方法、系统和程序产品
CN105788611A (zh) * 2016-02-25 2016-07-20 成都普创通信技术股份有限公司 一种音频质量在线监测系统
CN108446370A (zh) * 2018-03-15 2018-08-24 苏州思必驰信息科技有限公司 语音数据统计方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李明 等: "音频数字化工作流程", 《中国民族民间文艺基础资源数字化管理与共享平台的研究与实现》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112433797A (zh) * 2020-11-23 2021-03-02 苏州思必驰信息科技有限公司 可视化语音信号处理方法及系统
CN112433797B (zh) * 2020-11-23 2022-07-08 思必驰科技股份有限公司 可视化语音信号处理方法及系统
CN113673218A (zh) * 2021-08-20 2021-11-19 北京明略昭辉科技有限公司 音频数据分析方法、系统、存储介质及电子设备
CN116721678A (zh) * 2022-09-29 2023-09-08 荣耀终端有限公司 音频数据的监测方法、电子设备以及介质

Similar Documents

Publication Publication Date Title
KR101625944B1 (ko) 오디오 인식 방법 및 기기
US10097884B2 (en) Media playback method, client and system
CN104125509B (zh) 节目识别方法、装置及服务器
CN110096612A (zh) 语音日志的在线音频分析数据的获取方法及系统
CN110265064A (zh) 音频爆音检测方法、装置和存储介质
CN104091596B (zh) 一种乐曲识别方法、系统和装置
CN103021401B (zh) 基于互联网的多人异步合唱混音合成方法及合成系统
CN103475731A (zh) 一种媒体信息匹配、处理方法和设备
CN110503960B (zh) 语音识别结果的实时上载方法、装置、设备及存储介质
CN104517606A (zh) 语音识别测试方法及装置
CN112866770B (zh) 一种设备控制方法、装置、电子设备及存储介质
CN112017693B (zh) 一种音频质量评估方法及装置
CN109509472A (zh) 基于语音平台识别背景音乐的方法、装置及系统
CN103347070B (zh) 推送语音数据的方法、终端、服务器及系统
CN103903625A (zh) 音频的混音方法和装置
US9330392B2 (en) Collecting interest data from conversations conducted on a mobile device to augment a user profile
CN112463863A (zh) 一种云平台数据采集方法及装置
CN107196979A (zh) 基于语音识别的叫号预提醒系统
CN104157287A (zh) 音频处理方法及装置
CN103824556A (zh) 声音处理设备、声音处理方法和程序
JP4506004B2 (ja) 音楽認識装置
CN114546862A (zh) 对话测试方法、装置、电子设备及计算机可读存储介质
CN106257439A (zh) 多媒体播放器中的多媒体文件存储方法和装置
CN116297883B (zh) 一种基于敲击声的结构识别方法、装置、系统及终端设备
CN109787966A (zh) 一种基于可穿戴设备的监听方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20190806

RJ01 Rejection of invention patent application after publication