CN111489762B - 三维语谱图生成方法、装置、终端及存储介质 - Google Patents

三维语谱图生成方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111489762B
CN111489762B CN202010405172.2A CN202010405172A CN111489762B CN 111489762 B CN111489762 B CN 111489762B CN 202010405172 A CN202010405172 A CN 202010405172A CN 111489762 B CN111489762 B CN 111489762B
Authority
CN
China
Prior art keywords
image
parameter
spectrogram
energy
energy parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010405172.2A
Other languages
English (en)
Other versions
CN111489762A (zh
Inventor
黄族良
陈昊亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Speakin Intelligent Technology Co ltd
Original Assignee
Guangzhou Speakin Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Speakin Intelligent Technology Co ltd filed Critical Guangzhou Speakin Intelligent Technology Co ltd
Priority to CN202010405172.2A priority Critical patent/CN111489762B/zh
Publication of CN111489762A publication Critical patent/CN111489762A/zh
Application granted granted Critical
Publication of CN111489762B publication Critical patent/CN111489762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请公开了一种三维语谱图生成方法、装置、终端和计算机可读存储介质,三维语谱图生成方法通过在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;判断所述第一图像和所述第二图像之间是否符合预设规则;若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。

Description

三维语谱图生成方法、装置、终端及存储介质
技术领域
本申请涉及图像处理技术领域,尤其涉及一种三维语谱图生成方法、装置、终端及计算机可读存储介质。
背景技术
语谱图是采用二维平面表达三维信息的语音数据图。语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量大小。由于是采用二维平面表达三维信息,所以能量值的大小是通过不同颜色来表示的,即坐标点的颜色代表该语音点的语音能量值,颜色越深,表示该坐标点的语音能量越大。目前,当需要从语谱图读取某个语音点的能量信息时,需要先查询该语音点的颜色,然后再通过查询该颜色对应代表的能量大小,从而才能获得该语音点的能量值。由此可见,目前的二维语谱图信息读取不够直观、快捷,同时容易因为颜色查询的错误引起读取错误,读取准确率不高。
发明内容
本申请的主要目的在于提供一种三维语谱图生成方法、装置、终端及计算机存储介质,旨在解决现有技术中语音点能量值读取不够直观、快捷,同时准确率低的技术问题。
为实现上述目的,本申请实施例提供一种三维语谱图生成方法,所述三维语谱图生成方法的步骤包括:
在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断所述第一图像和所述第二图像之间是否符合预设规则;
若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
可选地,所述基于所述时间参数和所述能量参数生成第一图像的步骤包括:
获取所述原始语谱图中各所述时间参数和各所述能量参数的交点,作为第一交点;
获取所述原始语谱图中各所述时间参数、各所述能量参数和各所述第一交点,生成所述第一图像。
可选地,所述基于所述频率参数和所述能量参数生成第二图像的步骤包括:
获取所述原始语谱图中各所述频率参数和各所述能量参数的交点,作为第二交点;
获取所述原始语谱图中各所述频率参数、各所述能量参数和各所述第二交点,生成所述第二图像。
可选地,所述判断所述第一图像和所述第二图像之间是否符合预设规则的步骤包括:
获取所述第一图像预设区间中预设个数各所述第一交点;
获取所述第二图像所述预设区间中所述预设个数各所述第二交点;
基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则。
可选地,所述基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则的步骤包括:
依次获取各所述第一交点和各所述第二交点中的第一能量参数和第二能量参数;
比对所述第一能量参数、所述第二能量参数和所述原始语谱图预设区间中所述能量参数三者是否相同;
若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者相同,则所述第一图像和所述第二图像之间符合所述预设规则;
若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者不完全相同,则所述第一图像和所述第二图像之间不符合预设规则。
可选地,所述基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则的步骤还包括:
若所述第一图像和所述第二图像之间不符合所述预设规则,则重新获取所述原始语谱图的时间参数、频率参数和能量参数,并生成所述第一图像和所述第二图像。
可选地,所述将所述第一图像和所述第二图像进行3D合成,生成三维语谱图的步骤包括:
获取所述原始语谱图中各所述能量参数对应的各所述时间参数和各所述频率参数;
基于各所述能量参数、各所述时间参数和各所述频率参数,生成所述三维语谱图。
本申请还提供一种三维语谱图生成装置,所述三维语谱图生成装置包括:
获取模块,用于在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
生成模块,用于基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断模块,用于判断所述第一图像和所述第二图像之间是否符合预设规则;
合成模块,用于若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
可选地,所述生成模块包括:
第一获取子模块,用于获取所述原始语谱图中各所述时间参数和各所述能量参数的交点,作为第一交点;
第一生成子模块,用于获取所述原始语谱图中各所述时间参数、各所述能量参数和各所述第一交点,生成所述第一图像。
可选地,所述生成模块还包括:
第二获取子模块,用于获取所述原始语谱图中各所述频率参数和各所述能量参数的交点,作为第二交点;
第二生成子模块,用于获取所述原始语谱图中各所述频率参数、各所述能量参数和各所述第二交点,生成所述第二图像。
可选地,所述判断模块包括:
第三获取子模块,用于获取所述第一图像预设区间中预设个数各所述第一交点;
第四获取子模块,用于获取所述第二图像所述预设区间中所述预设个数各所述第二交点;
判断子模块,用于基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则。
可选地,所述判断子模块包括:
获取单元,用于依次获取各所述第一交点和各所述第二交点中的第一能量参数和第二能量参数;
比对单元,用于比对所述第一能量参数、所述第二能量参数和所述原始语谱图预设区间中所述能量参数三者是否相同;
第一判断单元,用于若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者相同,则所述第一图像和所述第二图像之间符合所述预设规则。
第二判断单元,用于若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者不完全相同,则所述第一图像和所述第二图像之间不符合预设规则。
可选地,所述判断子模块还包括:
第三判断单元,用于若所述第一图像和所述第二图像之间不符合所述预设规则,则重新获取所述原始语谱图的时间参数、频率参数和能量参数,并生成所述第一图像和所述第二图像。
可选地,所述合成模块包括:
第五获取子模块,用于获取所述原始语谱图中各所述能量参数对应的各所述时间参数和各所述频率参数;
第三生成子模块,用于基于各所述能量参数、各所述时间参数和各所述频率参数,生成所述三维语谱图。
本申请还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维语谱图生成程序,所述三维语谱图生成程序被所述处理器执行时实现如上所述的三维语谱图生成方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质上存储有三维语谱图生成程序,所述三维语谱图生成程序被处理器执行时实现如上所述的三维语谱图生成方法的步骤。
本申请公开了一种三维语谱图生成方法、装置、终端和计算机可读存储介质,所述三维语谱图生成方法通过在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;判断所述第一图像和所述第二图像之间是否符合预设规则;若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图,预设规则,是用于判断第一图像和第二图像语音数据是否准确吻合,生成三维语谱图之后,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一个可选的终端的硬件结构示意图;
图2为本申请三维语谱图生成方法第一实施例的流程示意图;
图3为本申请三维语谱图生成方法第二实施例的流程示意图;
图4为本申请三维语谱图生成方法第三实施例的流程示意图;
图5为本申请三维语谱图生成方法第四实施例、第五实施例和第六实施例所涉及的整体流程示意图;
图6为本申请三维语谱图生成装置的功能模块示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
如图1所示,图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。
本申请实施例终端可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网AR/VR装置、智能音箱、自动驾驶汽车等诸多联网设备。
如图1所示,该三维语谱图生成系统的架构设计包括节点和服务器,其设备结构可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该三维语谱图生成系统还可以包括用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。用户接口可以包括显示屏(Display)、触摸屏、摄像头(包括AR/VR设备)等,可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口、蓝牙接口、探针接口、3G/4G/5G联网通信接口等)。
本领域技术人员可以理解,图1中示出的三维语谱图生成系统结构并不构成对三维语谱图生成系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及三维语谱图生成程序。操作系统是管理和控制三维语谱图生成系统硬件和软件资源的程序,支持三维语谱图生成程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与三维语谱图生成系统中其它硬件和软件之间通信。
在图1所示的三维语谱图生成系统中,处理器1001用于执行存储器1005中存储的三维语谱图生成程序,实现以下步骤:
在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断所述第一图像和所述第二图像之间是否符合预设规则;
若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
获取所述原始语谱图中各所述时间参数和各所述能量参数的交点,作为第一交点;
获取所述原始语谱图中各所述时间参数、各所述能量参数和各所述第一交点,生成所述第一图像。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
获取所述原始语谱图中各所述频率参数和各所述能量参数的交点,作为第二交点;
获取所述原始语谱图中各所述频率参数、各所述能量参数和各所述第二交点,生成所述第二图像。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
获取所述第一图像预设区间中预设个数各所述第一交点;
获取所述第二图像所述预设区间中所述预设个数各所述第二交点;
基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
依次获取各所述第一交点和各所述第二交点中的第一能量参数和第二能量参数;
比对所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者是否相同;
若所述第一能量参数、所述第二能量参数和所述原始语谱图预设区间中所述能量参数三者相同,则所述第一图像和所述第二图像之间符合所述预设规则;
若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者不完全相同,则所述第一图像和所述第二图像之间不符合预设规则。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
若所述第一图像和所述第二图像之间不符合所述预设规则,则重新获取所述原始语谱图的时间参数、频率参数和能量参数,并生成所述第一图像和所述第二图像。
进一步地,处理器1001可以调用存储器1005中存储的三维语谱图生成程序,还执行以下操作:
获取所述原始语谱图中各所述能量参数对应的各所述时间参数和各所述频率参数;
基于各所述能量参数、各所述时间参数和各所述频率参数,生成所述三维语谱图。
基于上述硬件结构,提出本申请三维语谱图生成方法的各个实施例。
参照图2,本申请三维语谱图生成方法第一实施例提供一种三维语谱图生成方法,所述三维语谱图生成方法包括:
步骤S10,在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
在本申请公开的技术方案中,三维语谱图指的是具有空间立体感的语音数据频谱图,三维语谱图的横轴代表时间,纵轴代表频率,竖轴代表语音数据能量大小。原始语谱图指的是二维的(平面的)不具备空间立体感的语音数据频谱图,原始语谱图的横轴代表时间,纵轴代表频率,坐标点值代表语音数据能量大小。原始语谱图的时间参数、频率参数和能量参数分别指的是原始语谱图横轴、纵轴和坐标点的信息。
步骤S20,基于时间参数和能量参数生成第一图像,并基于频率参数和能量参数生成第二图像;
在本申请公开的技术方案中,第一图像和第二图像指的是由三维语谱图生成程序从原始语谱图的获取的时间参数、频率参数和能量参数组成的二维图像。其中,第一图像由时间参数和能量参数组成;第二图像由频率参数和能量参数组成。
步骤S30,判断第一图像和第二图像之间是否符合预设规则;
在本申请公开的技术方案中,预设规则指的是用于判断第一图像和第二图像之间关系的规则。
步骤S40,若第一图像和第二图像之间符合预设规则,则将第一图像和第二图像进行3D合成,生成三维语谱图。
具体地,3D合成指的是将二维图像合成生成三维图像。
在本实施例中,三维语谱图生成方法通过在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;判断所述第一图像和所述第二图像之间是否符合预设规则;若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
进一步地,在本申请三维语谱图生成方法第二实施例中,参照图3,步骤S20包括:
步骤S21,获取原始语谱图中各时间参数和各能量参数的交点,作为第一交点;
在本申请公开的技术方案中,原始语谱图中各时间参数和各能量参数存在交点,各频率参数和各能量参数也存在交点,因此可以得到第一交点,即原始语谱图中各时间参数和各能量参数的交点。
步骤S22,获取原始语谱图中各时间参数、各能量参数和各第一交点,生成第一图像;
在本申请公开的技术方案中,第一图像的横坐标为时间参数、纵坐标为能量参数、坐标点为时间参数和能量参数的交点。
步骤S23,获取原始语谱图中各频率参数和各能量参数的交点,作为第二交点;
在本申请公开的技术方案中,与步骤S21同理可得,各频率参数和各能量参数也存在交点,因此可以得到第二交点,即原始语谱图中各频率参数和各能量参数的交点。
步骤S24,获取原始语谱图中各频率参数、各能量参数和各第二交点,生成第二图像。
同理,在本申请公开的技术方案中,第二图像的横坐标为频率参数、纵坐标为能量参数、坐标点为频率参数和能量参数的交点。
在本实施例中,通过获取第一图像和第二图像,便于后续第一图像和第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
进一步地,在本申请三维语谱图生成方法第三实施例中,参照图4,步骤S30包括:
步骤S31,获取第一图像预设区间中预设个数各第一交点;
在本申请公开的技术方案中,预设区间中预设个数指的是包括了一定数量坐标点(不少于2个坐标点)的区间,在实施过程中可灵活设置,此处不做限制;第一交点是时间和能量的组合点,例如(1s,1J)、(2s,2J)等。
步骤S32,获取第二图像预设区间中预设个数各第二交点;
在本申请公开的技术方案中,获取第二交点的区间和个数需要和获取第一交点的区间和个数保持一致;第二交点是频率和能量的组合点,例如(1Hz,1J)、(2Hz,2J)等。
步骤S33,基于各第一交点和各第二交点,判断第一图像和第二图像之间是否符合预设规则。
在本实施例中,由预设区间中预设个数的第一交点和第二交点,来判断第一图像和第二图像之间是否符合预设规则,当第一图像和第二图像之间符合预设规则,则将第一图像和第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
进一步地,在本申请三维语谱图生成方法第四实施例中,参照图5,步骤S33包括:
步骤S331,依次获取各第一交点和各第二交点中的第一能量参数和第二能量参数;
在本申请公开的技术方案中,基于各第一交点和各第二交点,判断第一图像和第二图像之间是否符合预设规则的实施方法是,例如,交点(1s,1J)、交点(2s,2J)、交点(3s,3J)的第一能量参数是1J、2J、3J;交点(1Hz,1J)、交点(2Hz,2J)、交点(3Hz,3J)的第二能量参数是1J、2J、3J。
步骤S332,比对第一能量参数、第二能量参数和原始语谱图预设区间中能量参数三者是否相同;
例如,在原始语谱图中读取得到,时间1s、频率1Hz对应的能量参数是1J,同时第一能量参数和第二能量参数也是1J,并且,在原始语谱图中读取得到,时间2s、频率2Hz对应的能量参数是2J,同时第一能量参数和第二能量参数也是2J、在原始语谱图中读取得到,时间3s、频率3Hz对应的能量参数是3J,同时第一能量参数和第二能量参数也是3J,那么可以判断得到第一能量参数、第二能量参数和原始语谱图预设区间中能量参数三者完全相同。
步骤S333,若第一能量参数、第二能量参数和预设区间中能量参数三者相同,则第一图像和第二图像之间符合预设规则。
步骤S334,若第一能量参数、第二能量参数和预设区间中能量参数三者不完全相同,则第一图像和第二图像之间不符合预设规则。
在本实施例中,判断第一图像和第二图像之间是否符合预设规则,当第一图像和第二图像之间符合预设规则,则将第一图像和第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
进一步地,在本申请三维语谱图生成方法第五实施例中,继续参照图5,所述若第一能量参数、第二能量参数和预设区间中能量参数三者相同,则第一图像和第二图像之间符合预设规则的步骤之后,包括:
步骤S41,获取原始语谱图中各能量参数对应的各时间参数和各频率参数;
在本申请公开的技术方案中,原始语谱图中各能量参数对应的各时间参数指的是原始语谱图中时间和能量的关系;原始语谱图中各能量参数对应的各频率参数指的是原始语谱图中频率和能量的关系。例如,从原始语谱图中依次读取到时间1s、2s、3s、频率1Hz、2Hz、3Hz、能量1J、2J、3J,则能量1J对应时间1s、能量2J对应时间2s、能量3J对应时间3s;能量1J对应频率1Hz、能量2J对应2Hz、能量3J对应3Hz。
步骤S42,基于各能量参数、各时间参数和各频率参数,生成三维语谱图。
具体地,如上述例子,则生成的三维语谱图中3个坐标点的信息为:第一坐标点:时间1s、频率1Hz、能量1J;时间2s、频率2Hz、能量2J;时间3s、频率3Hz、能量3J。
在本实施例中,获取各能量参数、各时间参数和各频率参数之后,依次将各能量参数、各时间参数和各频率参数作为竖坐标、横坐标和纵坐标的参数,从而三维语谱图生成程序能够生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
进一步地,在本申请三维语谱图生成方法第六实施例中,继续参照图5,所述若第一能量参数、第二能量参数和预设区间中能量参数三者不完全相同,则第一图像和第二图像之间不符合预设规则的步骤之后,包括:
步骤S50,若第一图像和第二图像之间不符合预设规则,则重新获取原始语谱图的时间参数、频率参数和能量参数,并生成第一图像和第二图像。
在本申请公开的技术方案中,当第一能量参数、第二能量参数和预设区间中能量参数三者不完全相同,则判断得出第一图像和第二图像之间不符合预设规则,那么需要重新获取原始语谱图的时间参数、频率参数和能量参数,并生成第一图像和第二图像,然后继续执行步骤S30:判断第一图像和第二图像之间是否符合预设规则,只有当符合步骤S40:第一图像和第二图像之间符合预设规则,再将第一图像和第二图像进行3D合成,生成三维语谱图。
在本实施例中,生成第一图像和第二图像之后,三维语谱图生成程序能够将第一图像和第二图像进行3D合成,生成三维语谱图,从而用户可以从三维语谱图直观、准确、快捷地读取相关信息,提高了用户读取语谱图信息的效率和准确率。
此外,参照图6,本发明实施例还提出一种三维语谱图生成装置,三维语谱图生成装置包括:
获取模块,用于在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
生成模块,用于基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断模块,用于判断所述第一图像和所述第二图像之间是否符合预设规则;
合成模块,用于若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
本申请还提供一种终端,所述终端包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的三维语谱图生成程序,所述三维语谱图生成程序被所述处理器执行时实现上述三维语谱图生成方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有三维语谱图生成程序,所述三维语谱图生成程序被处理器执行时实现上述的三维语谱图生成方法的步骤。
在本申请三维语谱图生成方法、装置、终端及可读存储介质的实施例中,包含了上述三维语谱图生成方法各实施例的全部技术特征,说明书拓展和解释内容与上述三维语谱图生成方法各实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种三维语谱图生成方法,其特征在于,所述三维语谱图生成方法包括以下步骤:
在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断所述第一图像和所述第二图像之间是否符合预设规则,其中,所述预设规则是用于判断第一图像和第二图像的关系的规则;
若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
2.如权利要求1所述的三维语谱图生成方法,其特征在于,所述基于所述时间参数和所述能量参数生成第一图像的步骤包括:
获取所述原始语谱图中各所述时间参数和各所述能量参数的交点,作为第一交点;
获取所述原始语谱图中各所述时间参数、各所述能量参数和各所述第一交点,生成所述第一图像。
3.如权利要求2所述的三维语谱图生成方法,其特征在于,所述基于所述频率参数和所述能量参数生成第二图像的步骤包括:
获取所述原始语谱图中各所述频率参数和各所述能量参数的交点,作为第二交点;
获取所述原始语谱图中各所述频率参数、各所述能量参数和各所述第二交点,生成所述第二图像。
4.如权利要求3所述的三维语谱图生成方法,其特征在于,所述判断所述第一图像和所述第二图像之间是否符合预设规则的步骤包括:
获取所述第一图像预设区间中预设个数各所述第一交点;
获取所述第二图像所述预设区间中所述预设个数各所述第二交点;
基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则。
5.如权利要求4所述的三维语谱图生成方法,其特征在于,所述基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则的步骤包括:
依次获取各所述第一交点和各所述第二交点中的第一能量参数和第二能量参数;
比对所述第一能量参数、所述第二能量参数和所述原始语谱图预设区间中所述能量参数三者是否相同;
若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者相同,则所述第一图像和所述第二图像之间符合所述预设规则;
若所述第一能量参数、所述第二能量参数和所述预设区间中所述能量参数三者不完全相同,则所述第一图像和所述第二图像之间不符合预设规则。
6.如权利要求5所述的三维语谱图生成方法,其特征在于,所述基于各所述第一交点和各所述第二交点,判断所述第一图像和所述第二图像之间是否符合预设规则的步骤还包括:
若所述第一图像和所述第二图像之间不符合所述预设规则,则重新获取所述原始语谱图的时间参数、频率参数和能量参数,并生成所述第一图像和所述第二图像。
7.如权利要求1所述的三维语谱图生成方法,其特征在于,所述将所述第一图像和所述第二图像进行3D合成,生成三维语谱图的步骤包括:
获取所述原始语谱图中各所述能量参数对应的各所述时间参数和各所述频率参数;
基于各所述能量参数、各所述时间参数和各所述频率参数,生成所述三维语谱图。
8.一种三维语谱图生成装置,其特征在于,所述三维语谱图生成装置包括:
获取模块,用于在接收到三维语谱图生成请求时,获取原始语谱图的时间参数、频率参数和能量参数;
生成模块,用于基于所述时间参数和所述能量参数生成第一图像,并基于所述频率参数和所述能量参数生成第二图像;
判断模块,用于判断所述第一图像和所述第二图像之间是否符合预设规则,其中,所述预设规则是用于判断第一图像和第二图像的关系的规则;
合成模块,用于若所述第一图像和所述第二图像之间符合所述预设规则,则将所述第一图像和所述第二图像进行3D合成,生成三维语谱图。
9.一种三维语谱图生成终端,其特征在于,所述三维语谱图生成终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维语谱图生成程序,所述三维语谱图生成程序被所述处理器执行时实现如权利要求1至7中任一项所述的三维语谱图生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有三维语谱图生成程序,所述三维语谱图生成程序被处理器执行时实现如权利要求1至7中任一项所述的三维语谱图生成方法的步骤。
CN202010405172.2A 2020-05-13 2020-05-13 三维语谱图生成方法、装置、终端及存储介质 Active CN111489762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010405172.2A CN111489762B (zh) 2020-05-13 2020-05-13 三维语谱图生成方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010405172.2A CN111489762B (zh) 2020-05-13 2020-05-13 三维语谱图生成方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN111489762A CN111489762A (zh) 2020-08-04
CN111489762B true CN111489762B (zh) 2023-06-16

Family

ID=71795580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010405172.2A Active CN111489762B (zh) 2020-05-13 2020-05-13 三维语谱图生成方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111489762B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112863481B (zh) * 2021-02-27 2023-11-03 腾讯音乐娱乐科技(深圳)有限公司 一种音频生成方法及设备
US11941083B2 (en) * 2021-11-04 2024-03-26 Nuvoton Technology Corporation Quantifying signal purity by means of machine learning

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657535A (zh) * 2015-12-29 2016-06-08 北京搜狗科技发展有限公司 一种音频识别方法和装置
JP2016197030A (ja) * 2015-04-02 2016-11-24 川崎重工業株式会社 音信号の信号処理装置及び方法
CN107527626A (zh) * 2017-08-30 2017-12-29 北京嘉楠捷思信息技术有限公司 一种音频识别系统
CN108573520A (zh) * 2018-01-05 2018-09-25 深圳市鼎阳科技有限公司 一种三维频谱图的显示方法及数字频谱分析仪
CN109448733A (zh) * 2019-01-07 2019-03-08 广州势必可赢网络科技有限公司 一种语谱图生成方法、系统及相关装置
CN109861932A (zh) * 2019-02-15 2019-06-07 中国人民解放军战略支援部队信息工程大学 一种基于智能图像分析的短波莫尔斯报文自动识别方法
JP2020021098A (ja) * 2019-10-29 2020-02-06 カシオ計算機株式会社 情報処理装置、電子機器及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016197030A (ja) * 2015-04-02 2016-11-24 川崎重工業株式会社 音信号の信号処理装置及び方法
CN105657535A (zh) * 2015-12-29 2016-06-08 北京搜狗科技发展有限公司 一种音频识别方法和装置
CN107527626A (zh) * 2017-08-30 2017-12-29 北京嘉楠捷思信息技术有限公司 一种音频识别系统
CN108573520A (zh) * 2018-01-05 2018-09-25 深圳市鼎阳科技有限公司 一种三维频谱图的显示方法及数字频谱分析仪
CN109448733A (zh) * 2019-01-07 2019-03-08 广州势必可赢网络科技有限公司 一种语谱图生成方法、系统及相关装置
CN109861932A (zh) * 2019-02-15 2019-06-07 中国人民解放军战略支援部队信息工程大学 一种基于智能图像分析的短波莫尔斯报文自动识别方法
JP2020021098A (ja) * 2019-10-29 2020-02-06 カシオ計算機株式会社 情報処理装置、電子機器及びプログラム

Also Published As

Publication number Publication date
CN111489762A (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
CN111489762B (zh) 三维语谱图生成方法、装置、终端及存储介质
RU2592062C1 (ru) Система и способ управления внешним устройством, соединенным с устройством
EP2713272A1 (en) Method, device and system for presenting augmented reality contents
JP6904683B2 (ja) 通信ネットワークを試験するための、マシン可読コードを利用するシステム及び方法
CN114640727B (zh) 协议解析方法、装置及计算机可读存储介质
CN110426967B (zh) 家用负荷数据的模拟仿真方法、装置和存储介质
CN109922457B (zh) 信息交互方法、装置及系统
CN108282664B (zh) 图像处理方法、装置、系统及计算机可读存储介质
CN112506465B (zh) 全景漫游中场景切换的方法和装置
CN110442806B (zh) 用于识别图像的方法和装置
CN108156659B (zh) 家电设备的定位方法、装置、家电设备及存储介质
CN107390077B (zh) 测试方法、测试装置及计算机可读存储介质
CN111510714B (zh) 一种重显率确定方法、装置、终端及存储介质
CN114363597A (zh) 文字投影方法、装置、机器人及存储介质
CN111339196B (zh) 基于区块链的数据处理方法、系统及计算机可读存储介质
CN114413918A (zh) 行程信息分享方法、相关装置、系统以及电子设备
CN116740289B (zh) 输电线路模型的生成方法、装置、电子设备和存储介质
CN111367592A (zh) 信息处理方法和装置
CN116684561B (zh) 开机图像的调整方法、装置、电子设备及存储介质
CN114942814B (zh) 页面组件的聚焦方法、系统、终端设备及介质
CN112153735B (zh) 设备定位方法、装置、存储介质及电子设备
CN116993751A (zh) 图像裁剪参数确定方法、装置、介质及电子设备
CN111291199B (zh) 信息查询方法和装置
CN117573015A (zh) 图像检测方法、装置、设备及可读存储介质
CN116048442A (zh) 显示参数管理方法、电子设备、存储介质及显示设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant