CN113472944B - 智能终端的语音自适应处理方法、装置、设备及存储介质 - Google Patents

智能终端的语音自适应处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113472944B
CN113472944B CN202110896558.2A CN202110896558A CN113472944B CN 113472944 B CN113472944 B CN 113472944B CN 202110896558 A CN202110896558 A CN 202110896558A CN 113472944 B CN113472944 B CN 113472944B
Authority
CN
China
Prior art keywords
voice
voice data
data
format
cache
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110896558.2A
Other languages
English (en)
Other versions
CN113472944A (zh
Inventor
唐国兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Ouqing Electronics Co ltd
Original Assignee
Suzhou Ouqing Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Ouqing Electronics Co ltd filed Critical Suzhou Ouqing Electronics Co ltd
Priority to CN202110896558.2A priority Critical patent/CN113472944B/zh
Publication of CN113472944A publication Critical patent/CN113472944A/zh
Application granted granted Critical
Publication of CN113472944B publication Critical patent/CN113472944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种智能终端的语音自适应处理方法、装置、设备及存储介质。所述智能终端的语音自适应处理方法,包括:获取智能终端的当前缓存语音数据;在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。本发明实施例的技术方案能够实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。

Description

智能终端的语音自适应处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及智能终端技术领域,尤其涉及一种智能终端的语音自适应处理方法、装置、设备及存储介质。
背景技术
随着社会经济的发展,科技水平的逐渐提高,智能终端已经成为人们生活中必不可少的通信和娱乐工具。通过语音与智能终端进行信息交互也越来越普遍,这使得智能终端的语音处理成为智能终端技术领域的一个重要分支。
虽然智能终端的语音格式在不断更新,但是智能终端无法及时与当前版本之外的语音格式适配。而智能终端与当前版本之外的语音格式不能适配,将会使智能终端无法通过当前版本之外的语音格式提高语音数据处理效率。例如,现有的智能终端的语音格式主要是ATV0.4e,随着ATV1.0的发布,如果现有的智能终端无法及时与ATV1.0适配,则无法通过ATV1.0语音格式提高语音数据处理效率。
发明内容
本发明实施例提供一种智能终端的语音自适应处理方法、装置、设备及存储介质,能够实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
第一方面,本发明实施例提供了一种智能终端的语音自适应处理方法,包括:
获取智能终端的当前缓存语音数据;
在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;
根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
第二方面,本发明实施例还提供了一种智能终端的语音自适应处理装置,包括:
当前缓存语音数据获取模块,用于获取智能终端的当前缓存语音数据;
备份缓存语音数据获取模块,用于在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;
目标缓存语音数据缓存模块,用于根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的智能终端的语音自适应处理方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的智能终端的语音自适应处理方法。
本发明实施例通过获取智能终端的当前缓存语音数据,进而在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据,从而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。由于目标兼容语音格式可以是智能终端能够兼容的,与当前版本不同的语音格式,因此当目标兼容语音格式为智能终端的当前语音格式时,智能终端能够实现与目标兼容语音格式的适配。在当前缓存语音数据的数据量超过预设缓存阈值时,智能终端将不能进行正常的数据传输,如果不利用目标兼容语音格式,则只能是按照当前版本语音格式将通过第一语音采样频率采集的备份缓存语音数据进行缓存,这会加重智能终端的数据处理负担。本方案没有直接将备份缓存语音数据进行缓存,而是在当前语音格式为目标兼容语音格式的情况下,通过第二语音采样频率对备份缓存语音数据采集语音数据,进一步将采集的语音数据作为目标语音数据进行缓存,降低了智能终端的数据处理负担,从而提高了数据处理效率,解决了现有技术中智能终端与当前版本不同的语音格式无法适配,以及智能终端无法利用与当前版本不同的语音格式提升语音数据处理效率的问题,实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
附图说明
图1是本发明实施例一提供的一种智能终端的语音自适应处理方法的流程图;
图2是本发明实施例二提供的一种智能终端的语音自适应处理方法的流程图;
图3是本发明实施例二提供的一种将第一采集语音数据和第二采集语音数据进行重组处理的示意图;
图4是本发明实施例三提供的一种智能终端的语音自适应处理装置的示意图;
图5为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种智能终端的语音自适应处理方法的流程图,本实施例可适用于智能终端通过与当前版本不同的语音格式对语音数据进行高效自适应处理的情况,该方法可以由智能终端的语音自适应处理装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。
相应的,如图1所示,该方法包括如下操作:
S110、获取智能终端的当前缓存语音数据。
其中,当前缓存语音数据可以是智能终端本地当前缓存的语音数据。
在本发明实施例中,可以从智能终端的数据缓存单元中获取智能终端的当前缓存语音数据。
S120、在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据。
其中,预设缓存阈值可以是预设的数值,用于表征智能终端正常传输数据时数据存储单元能够缓存的最大数据量。目标兼容语音格式可以是智能终端能够兼容的,支持动态带宽调整的语音格式。可选的,目标兼容语音格式可以是最新版本的语音格式。当前语音格式可以是智能终端当前采用的语音格式。可选的,当前语音格式可以是智能终端能够兼容的任意一种语音格式。第一语音采样频率可以是智能终端预设的采样频率,可以是智能终端常用的采集频率,可以实现对语音数据的全面采集。示例性的,第一语音采样频率可以包括16KHz等。本发明实施例对第一语音采样频率的具体频率数值不作限定。备份缓存语音数据可以是智能终端通过第一语音采样频率采集到的语音数据。
在本发明实施例中,可以根据智能终端的数据缓存单元的数据容量确定预设缓存阈值,在得到预设缓存阈值和当前缓存语音数据之后,可以将智能终端的当前缓存语音数据与预设缓存阈值进行比较。如果当前缓存语音数据的数据量超过预设缓存阈值,并且智能终端的当前语音格式为目标兼容语音格式,则可以进一步以第一语音采集频率采集语音数据,进而可以将利用第一语音采集频率采集的语音数据作为备份缓存语音数据。
S130、根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
其中,第二语音采样频率可以是根据备份缓存语音数据确定的采样频率。可选的,第二语音采样频率可以小于第一语音采样频率。目标缓存语音数据可以是备份缓存语音数据中的部分数据,需要缓存于智能终端的数据缓存单元中。
在本发明实施例中,可以利用第二语音采集频率对备份缓存语音数据进行数据采集,进而可以将再次采集的语音数据作为目标缓存语音数据。在得到目标缓存语音数据之后,可以进一步将目标缓存语音数据缓存于智能终端的数据缓存单元中。
本发明实施例通过获取智能终端的当前缓存语音数据,进而在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据,从而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。由于目标兼容语音格式可以是智能终端能够兼容的,与当前版本不同的语音格式,因此当目标兼容语音格式为智能终端的当前语音格式时,智能终端能够实现与目标兼容语音格式的适配。在当前缓存语音数据的数据量超过预设缓存阈值时,智能终端将不能进行正常的数据传输,如果不利用目标兼容语音格式,则只能是按照当前版本语音格式将通过第一语音采样频率采集的备份缓存语音数据进行缓存,这会加重智能终端的数据处理负担。本方案没有直接将备份缓存语音数据进行缓存,而是在当前语音格式为目标兼容语音格式的情况下,通过第二语音采样频率对备份缓存语音数据采集语音数据,进一步将采集的语音数据作为目标语音数据进行缓存,降低了智能终端的数据处理负担,从而提高了数据处理效率,解决了现有技术中智能终端与当前版本不同的语音格式无法适配,以及智能终端无法利用与当前版本不同的语音格式提升语音数据处理效率的问题,实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
实施例二
图2是本发明实施例二提供的一种智能终端的语音自适应处理方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,给出了将智能终端的当前语音格式配置为目标兼容语音格式,进而获取智能终端的当前缓存语音数据,以及根据第一语音采样频率采集语音数据,得到备份缓存语音数据,从而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存的具体可选的实施方案。相应的,如图2所示,该方法包括如下操作:
S210、确定智能终端的目标兼容语音格式。
在本发明实施例中,智能终端可以从存储有与目标兼容语音格式相关联数据的设备侧获取目标兼容语音格式。
在本发明的一个可选实施例中,确定智能终端的目标兼容语音格式,可以包括:向语音格式更新信息存储设备发送语音兼容更新请求,并获取语音格式更新信息存储设备反馈的语音兼容格式响应数据;根据语音兼容格式响应数据确定目标兼容语音格式。
其中,语音格式更新信息存储设备可以是存储有与目标兼容语音格式相关联数据的设备。语音兼容更新请求可以是智能终端向语音格式更新信息存储设备发送的请求,用于获取与目标兼容语音格式相关的数据。语音兼容格式响应数据可以是语音格式更新信息存储设备根据语音兼容更新请求,向智能终端反馈的数据。
在本发明实施例中,当智能终端的语音格式需要更新时,可以向语音格式更新信息存储设备发送语音兼容更新请求。语音格式更新信息存储设备可以根据语音兼容更新请求确定语音兼容格式响应数据,进而向智能终端发送语音兼容格式响应数据。智能终端可以对接收到的语音兼容格式响应数据进行数据解析,得到目标兼容语音格式。
S220、将智能终端的当前语音格式配置为目标兼容语音格式。
在本发明实施例中,可以通过修改智能终端的当前语音格式的配置参数,使智能终端的当前语音格式更换为目标兼容语音格式。
在本发明的一个可选的实施例中,智能终端可以包括智能遥控器,当前语音格式可以包括ATV0.4e格式,目标兼容语音格式可以包括ATV1.0格式。
其中,ATV0.4e是安卓电视的语音格式。ATV1.0是谷歌最新发布的安卓电视的语音格式。智能终端还可以是智能手环以及智能台灯等设备,本发明实施例对智能终端的具体设备类型不作限定。此外,目标兼容语音格式还可以随着智能终端的发展不断更新,也即本发明实施例并不对目标兼容语音格式具体语音格式类型进行限定。当智能终端不能兼容多个语音版本的情况下,如果遭到数据传输干扰,则语音数据容易产生丢包现象,造成语音数据质量较差的问题。
示例性的,当语音规格书为“VoiceoverBLERemotecontrolspecs-draft-ver0.4e”时,将ATVV_CHAR_TX的属性设定为“Write”,则智能终端的可以支持ATV0.4e语音格式。当语音规格书为“Google Voice over BLE spec 1.0”时,将ATVV_CHAR_TX的属性设定为“Writewithout Response”,则智能终端可以支持ATV1.0语音格式。在本方案中,将ATVV_CHAR_TX的属性改为“Write without Response”或者“Write”,此时智能终端(比如蓝牙遥控器)可以支持ATV0.4e语音格式以及ATV1.0语音格式,进而可以自动适应语音的不同格式版本要求。
S230、获取智能终端的当前缓存语音数据。
S240、在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据。
在本发明实施例中,可以以第一语音采样频率采集语音数据,得到备份缓存语音数据。其中,备份缓存语音数据具备统一的采样频率。也即在采集备份缓存语音数据时,不需要切换采样频率,可以按照原有的采样频率继续采集语音数据,这样可以防止由于采样频率切换所导致的语音采集中断的问题。
S250、确定备份缓存语音数据的固定数据长度。
其中,固定数据长度可以是按照第一语音采样频率,在一次语音数据采样过程中采集的数据的长度。
在本发明实施例中,可以首先确定在按照第一语音采样频率采集语音数据时,一次采样过程中采集的语音数据的长度,进而可以将一次采样过程中采集的语音数据的长度作为备份缓存语音数据的固定数据长度。
S260、根据备份缓存语音数据的固定数据长度下调第一语音采样频率,得到第二语音采样频率。
其中,第二语音采样频率可以为第一语音采样频率的一半。
在本发明实施例中,可以根据备份缓存语音数据的固定数据长度下调第一语音采样频率,并将下调后的采样频率作为第二语音采样频率。
示例性的,当第一语音采样频率为16KHz时,第二语音采样频率为8KHz。一般情况下,当语音采样频率为16KHz时,语音品质较高但数据量较大。当语音采样频率为8KHz时,语音品质稍差但数据量较小。在本方案中的智能终端支持不同的采样频率,可以实现16KHz到8KHz的采样频率的切换。
S270、根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
示例性的,当智能终端为智能遥控器的情况下,智能遥控器可以将目标缓存语音数据进行数据格式转换处理,形成语音数据包,进而将语音数据包传输至机顶盒设备。由此可知,机顶盒设备得到的语音数据包是降频后的数据。
示例性的,可以将预设缓存阈值设置为智能终端的数据缓存单元数据容量的85%。在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为ATV1.0语音格式的情况下,以16KHz采集语音数据,得到备份缓存语音数据,并以8KHz对备份缓存语音数据采集语音数据。本发明实施例并不对预设缓存阈值的具体数值进行限定。可选的,还可以在当前缓存语音数据的数据量低于智能终端的数据缓存单元数据容量的25%的情况下,以16KHz采集语音数据,得到备份缓存语音数据,并直接将备份缓存语音数据进行缓存。本发明实施例在将备份缓存语音数据直接进行缓存时,对当前缓存语音数据的数据量与智能终端的数据缓存单元数据容量的比值不作限定。需要说明的是,在直接将备份缓存语音数据进行缓存时,当前缓存语音数据的数据量与智能终端的数据缓存单元数据容量的比值,明显区别于预设缓存阈值与智能终端的数据缓存单元数据容量的比值,这样可以避免智能终端频繁切换语音数据的采样频率。
在本发明的一个可选的实施例中,根据第二语音采样频率对备份缓存语音数据采集语音数据,可以包括:根据第二语音采样频率对第一待采集语音数据采集第一采集语音数据,并对第二待采集语音数据采集第二采集语音数据;对第一采集语音数据和第二采集语音数据进行重组,得到目标缓存语音数据。
其中,第一待采集语音数据可以是在备份缓存语音数据中的,按照第一语音数据采样频率采样一次的语音数据。第二待采集语音数据可以是在备份缓存语音数据中的,在采集到第一待采集语音数据之后,按照第一语音数据采样频率再次采集得到的语音数据。第一待采集语音数据与第二待采集语音数据是两次相邻采样得到的语音数据。
在本发明实施例中,可以首先从备份缓存语音数据中确定第一待采集语音数据以及第二待采集语音数据,进而按照第二语音采样频率对第一待采集语音数据进行数据采集,得到第一采集语音数据,并按照第二语音采样频率对第二待采集语音数据进行数据采集,得到第二采集语音数据。根据第一待采集语音数据与第二待采集语音数据的采样顺序,对第一采集语音数据和第二采集语音数据进行重组,将重组得到的数据作为目标缓存语音数据。
在本发明的一个可选的实施例中,根据第二语音采样频率对第一待采集语音数据采集第一采集语音数据,并对第二待采集语音数据采集第二采集语音数据,可以包括:根据第二语音采样频率按照隔一选一的方式从第一待采集语音数据中采集第一采集语音数据;根据第二语音采样频率按照隔一选一的方式从第二待采集语音数据中采集第二采集语音数据。
其中,隔一选一的方式可以用于将同一数组中位于偶数位或奇数位的数据进行分组。
在本发明实施例中,可以根据第二采集语音采样频率按照隔一选一的方式,将第一待采集语音数据的奇数位数据和偶数位数据进行分组,进而将奇数位数据或偶数位数据作为第一采集语音数据。相应的,根据第二采集语音采样频率按照隔一选一的方式,将第二待采集语音数据的奇数位数据和偶数位数据进行分组,进而将奇数位数据或偶数位数据作为第二采集语音数据。需要说明的是,本发明实施例对第一采集语音数据属于第一待采集语音数据的奇数位数据还是偶数位数据不作限定。相应的,对第二采集语音数据属于第二待采集语音数据的奇数位数据还是偶数位数据也不作限定。例如,可以将第一待采集语音数据的奇数位数据作为第一采集语音数据,将第二待采集语音数据的偶数位数据作为第二采集语音数据。可选的,为了保证奇数位数据与偶数位数据取舍的一致性,可以将第一待采集语音数据的奇数位数据作为第一采集语音数据,并将第二待采集语音数据的奇数位数据作为第二采集语音数据;或者,将第一待采集语音数据的偶数位数据作为第一采集语音数据,并将第二待采集语音数据的偶数位数据作为第二采集语音数据。
图3是本发明实施例二提供的一种将第一采集语音数据和第二采集语音数据进行重组处理的示意图,如图3所示,第一待采集语音数据为01234567,第二待采集语音数据为01234567。当第二语音采样频率为第一语音采样频率的一半时,可以将第一待采集语音数据的奇数位数据0246作为第一采集语音数据,将第二待采集语音数据的奇数位数据0246作为第二采集语音数据,进而可以将第一采集语音数据与第二采集语音数据重组,得到02460246(目标缓存语音数据)。
本发明实施例通过确定智能终端的目标兼容语音格式,进而将智能终端的当前语音格式配置为目标兼容语音格式,进一步获取智能终端的当前缓存语音数据。在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据。在得到备份缓存语音数据之后,可以进一步确定备份缓存语音数据的固定数据长度,并根据备份缓存语音数据的固定数据长度下调第一语音采样频率,得到第二语音采样频率,进而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。由于目标兼容语音格式可以是智能终端能够兼容的,与当前版本不同的语音格式,因此当目标兼容语音格式为智能终端的当前语音格式时,智能终端能够实现与目标兼容语音格式的适配。在当前缓存语音数据的数据量超过预设缓存阈值时,智能终端将不能进行正常的数据传输,如果不利用目标兼容语音格式,则只能是按照当前版本语音格式将通过第一语音采样频率采集的备份缓存语音数据进行缓存,这会加重智能终端的数据处理负担。本方案没有直接将备份缓存语音数据进行缓存,而是在当前语音格式为目标兼容语音格式的情况下,通过第二语音采样频率对备份缓存语音数据采集语音数据,进一步将采集的语音数据作为目标语音数据进行缓存,降低了智能终端的数据处理负担,从而提高了数据处理效率,解决了现有技术中智能终端与当前版本不同的语音格式无法适配,以及智能终端无法利用与当前版本不同的语音格式提升语音数据处理效率的问题,实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
本发明实施例的技术方案中,所涉及语音数据的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
实施例三
图4是本发明实施例三提供的一种智能终端的语音自适应处理装置的示意图,如图4所示,所述装置包括:当前缓存语音数据获取模块310、备份缓存语音数据获取模块320以及目标缓存语音数据缓存模块330,其中:
当前缓存语音数据获取模块310,用于获取智能终端的当前缓存语音数据;
备份缓存语音数据获取模块320,用于在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;
目标缓存语音数据缓存模块330,用于根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
本发明实施例通过获取智能终端的当前缓存语音数据,进而在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据,从而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。由于目标兼容语音格式可以是智能终端能够兼容的,与当前版本不同的语音格式,因此当目标兼容语音格式为智能终端的当前语音格式时,智能终端能够实现与目标兼容语音格式的适配。在当前缓存语音数据的数据量超过预设缓存阈值时,智能终端将不能进行正常的数据传输,如果不利用目标兼容语音格式,则只能是按照当前版本语音格式将通过第一语音采样频率采集的备份缓存语音数据进行缓存,这会加重智能终端的数据处理负担。本方案没有直接将备份缓存语音数据进行缓存,而是在当前语音格式为目标兼容语音格式的情况下,通过第二语音采样频率对备份缓存语音数据采集语音数据,进一步将采集的语音数据作为目标语音数据进行缓存,降低了智能终端的数据处理负担,从而提高了数据处理效率,解决了现有技术中智能终端与当前版本不同的语音格式无法适配,以及智能终端无法利用与当前版本不同的语音格式提升语音数据处理效率的问题,实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
可选的,智能终端的语音自适应处理装置还包括语音格式配置模块,用于确定所述智能终端的目标兼容语音格式;将所述智能终端的当前语音格式配置为所述目标兼容语音格式。
可选的,语音格式配置模块,具体用于:向语音格式更新信息存储设备发送语音兼容更新请求,并获取所述语音格式更新信息存储设备反馈的语音兼容格式响应数据;根据所述语音兼容格式响应数据确定所述目标兼容语音格式。
可选的,智能终端的语音自适应处理装置还包括第二语音采样频率确定模块,用于确定所述备份缓存语音数据的固定数据长度;根据所述备份缓存语音数据的固定数据长度下调所述第一语音采样频率,得到所述第二语音采样频率;其中,所述第二语音采样频率为所述第一语音采样频率的一半。
可选的,目标缓存语音数据缓存模块330,具体用于:根据所述第二语音采样频率对第一待采集语音数据采集第一采集语音数据,并对第二待采集语音数据采集第二采集语音数据;对所述第一采集语音数据和所述第二采集语音数据进行重组,得到所述目标缓存语音数据。
可选的,目标缓存语音数据缓存模块330,具体用于:根据所述第二语音采样频率按照隔一选一的方式从所述第一待采集语音数据中采集所述第一采集语音数据;根据所述第二语音采样频率按照隔一选一的方式从所述第二待采集语音数据中采集所述第二采集语音数据。
可选的,所述智能终端包括智能遥控器,所述当前语音格式包括ATV0.4e格式,所述目标兼容语音格式包括ATV1.0格式。
上述智能终端的语音自适应处理装置可执行本发明任意实施例所提供的智能终端的语音自适应处理方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的智能终端的语音自适应处理方法。
由于上述所介绍的智能终端的语音自适应处理装置为可以执行本发明实施例中的智能终端的语音自适应处理方法的装置,故而基于本发明实施例中所介绍的智能终端的语音自适应处理方法,本领域所属技术人员能够了解本实施例的智能终端的语音自适应处理装置的具体实施方式以及其各种变化形式,所以在此对于该智能终端的语音自适应处理装置如何实现本发明实施例中的智能终端的语音自适应处理方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中智能终端的语音自适应处理方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
图5为本发明实施例四提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的电子设备412的框图。图5显示的电子设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备412以通用计算设备的形式表现。电子设备412的组件可以包括但不限于:一个或者多个处理器416,存储装置428,连接不同系统组件(包括存储装置428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)430和/或高速缓存存储器432。电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块426的程序436,可以存储在例如存储装置428中,这样的程序模块426包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块426通常执行本发明所描述的实施例中的功能和/或方法。
电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、摄像头、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备412交互的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口422进行。并且,电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与电子设备412的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器416通过运行存储在存储装置428中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的智能终端的语音自适应处理方法:获取智能终端的当前缓存语音数据;在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
本发明实施例通过获取智能终端的当前缓存语音数据,进而在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据,从而根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。由于目标兼容语音格式可以是智能终端能够兼容的,与当前版本不同的语音格式,因此当目标兼容语音格式为智能终端的当前语音格式时,智能终端能够实现与目标兼容语音格式的适配。在当前缓存语音数据的数据量超过预设缓存阈值时,智能终端将不能进行正常的数据传输,如果不利用目标兼容语音格式,则只能是按照当前版本语音格式将通过第一语音采样频率采集的备份缓存语音数据进行缓存,这会加重智能终端的数据处理负担。本方案没有直接将备份缓存语音数据进行缓存,而是在当前语音格式为目标兼容语音格式的情况下,通过第二语音采样频率对备份缓存语音数据采集语音数据,进一步将采集的语音数据作为目标语音数据进行缓存,降低了智能终端的数据处理负担,从而提高了数据处理效率,解决了现有技术中智能终端与当前版本不同的语音格式无法适配,以及智能终端无法利用与当前版本不同的语音格式提升语音数据处理效率的问题,实现多种语音格式的兼容,进而通过与当前版本不同的语音格式提高语音数据处理效率。
实施例五
本发明实施例五还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的智能终端的语音自适应处理方法:获取智能终端的当前缓存语音数据;在确定当前缓存语音数据的数据量超过预设缓存阈值,且智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;根据第二语音采样频率对备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable Read OnlyMemory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种智能终端的语音自适应处理方法,其特征在于,包括:
确定所述智能终端的目标兼容语音格式;
将所述智能终端的当前语音格式配置为所述目标兼容语音格式;
获取智能终端的当前缓存语音数据;
在确定所述当前缓存语音数据的数据量超过预设缓存阈值,且所述智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;
根据第二语音采样频率对所述备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存;
所述目标兼容格式为支持动态带宽调整的语音格式;所述智能终端用于将所述目标缓存语音数据传输至待接收设备;
在所述根据第二语音采样频率对所述备份缓存语音数据采集语音数据之前,还包括:
确定所述备份缓存语音数据的固定数据长度;
根据所述备份缓存语音数据的固定数据长度下调所述第一语音采样频率,得到所述第二语音采样频率;
其中,所述第二语音采样频率为所述第一语音采样频率的一半。
2.根据权利要求1所述的方法,其特征在于,所述确定所述智能终端的目标兼容语音格式,包括:
向语音格式更新信息存储设备发送语音兼容更新请求,并获取所述语音格式更新信息存储设备反馈的语音兼容格式响应数据;
根据所述语音兼容格式响应数据确定所述目标兼容语音格式。
3.根据权利要求1所述的方法,其特征在于,所述根据第二语音采样频率对所述备份缓存语音数据采集语音数据,包括:
根据所述第二语音采样频率对第一待采集语音数据采集第一采集语音数据,并对第二待采集语音数据采集第二采集语音数据;
对所述第一采集语音数据和所述第二采集语音数据进行重组,得到所述目标缓存语音数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第二语音采样频率对第一待采集语音数据采集第一采集语音数据,并对第二待采集语音数据采集第二采集语音数据,包括:
根据所述第二语音采样频率按照隔一选一的方式从所述第一待采集语音数据中采集所述第一采集语音数据;
根据所述第二语音采样频率按照隔一选一的方式从所述第二待采集语音数据中采集所述第二采集语音数据。
5.一种智能终端的语音自适应处理装置,其特征在于,包括:
语音格式配置模块,用于确定所述智能终端的目标兼容语音格式;将所述智能终端的当前语音格式配置为所述目标兼容语音格式
当前缓存语音数据获取模块,用于获取智能终端的当前缓存语音数据;
备份缓存语音数据获取模块,用于在确定所述当前缓存语音数据的数据量超过预设缓存阈值,且所述智能终端的当前语音格式为目标兼容语音格式的情况下,根据第一语音采样频率采集语音数据,得到备份缓存语音数据;
目标缓存语音数据缓存模块,用于根据第二语音采样频率对所述备份缓存语音数据采集语音数据,并将采集的语音数据作为目标缓存语音数据进行缓存;
所述目标兼容格式为支持动态带宽调整的语音格式;所述智能终端用于将所述目标缓存语音数据传输至待接收设备;
第二语音采样频率确定模块,用于确定所述备份缓存语音数据的固定数据长度;根据所述备份缓存语音数据的固定数据长度下调所述第一语音采样频率,得到所述第二语音采样频率;其中,所述第二语音采样频率为所述第一语音采样频率的一半。
6.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的智能终端的语音自适应处理方法。
7.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的智能终端的语音自适应处理方法。
CN202110896558.2A 2021-08-05 2021-08-05 智能终端的语音自适应处理方法、装置、设备及存储介质 Active CN113472944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110896558.2A CN113472944B (zh) 2021-08-05 2021-08-05 智能终端的语音自适应处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110896558.2A CN113472944B (zh) 2021-08-05 2021-08-05 智能终端的语音自适应处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113472944A CN113472944A (zh) 2021-10-01
CN113472944B true CN113472944B (zh) 2022-12-13

Family

ID=77884175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110896558.2A Active CN113472944B (zh) 2021-08-05 2021-08-05 智能终端的语音自适应处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113472944B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021135515A1 (zh) * 2020-06-17 2021-07-08 平安科技(深圳)有限公司 音视频通话的处理方法、系统、编解码器及存储装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4367657B2 (ja) * 2004-04-09 2009-11-18 日本電気株式会社 音声通信方法及び装置
CN101409808B (zh) * 2008-10-15 2010-10-13 北京创毅视讯科技有限公司 一种音频重采样方法、装置及一种数字电视芯片
CN105897666A (zh) * 2015-10-08 2016-08-24 乐视致新电子科技(天津)有限公司 实时语音通话中的实时语音接收设备及降低延迟的方法
CN106209773A (zh) * 2016-06-24 2016-12-07 深圳羚羊极速科技有限公司 一种音频分组采样传输再重组的方法
US10871935B2 (en) * 2018-09-18 2020-12-22 Roku, Inc. Audio cancellation and content recognition of audio received over HDMI/ARC
US10867615B2 (en) * 2019-01-25 2020-12-15 Comcast Cable Communications, Llc Voice recognition with timing information for noise cancellation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021135515A1 (zh) * 2020-06-17 2021-07-08 平安科技(深圳)有限公司 音视频通话的处理方法、系统、编解码器及存储装置

Also Published As

Publication number Publication date
CN113472944A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
US11270690B2 (en) Method and apparatus for waking up device
CN107592238A (zh) 接口的自动测试方法及系统、服务终端、存储器
CN108874825B (zh) 一种异常数据的校验方法和装置
CN109558386A (zh) 一种客户端数据的缓存方法、装置、设备和介质
CN116627333A (zh) 日志缓存方法、装置、电子设备及计算机可读存储介质
CN111352957A (zh) 远程字典服务优化方法及相关设备
CN107135108A (zh) 网络连接列表的更新方法及系统
CN113472944B (zh) 智能终端的语音自适应处理方法、装置、设备及存储介质
CN116450353A (zh) 处理器核匹配方法、装置、电子设备及存储介质
CN111752916B (zh) 数据采集方法及装置、计算机可读存储介质、电子设备
CN109684611A (zh) 一种字典转码方法、装置、存储介质及终端
CN115454666A (zh) 消息队列集群间的数据同步方法和装置
CN113918436A (zh) 日志处理方法及装置
CN104735097A (zh) 信息的收集方法和系统
CN113778977A (zh) 数据处理方法和数据处理装置
CN113342501B (zh) 系统故障处理方法及装置
CN112311840A (zh) 一种多终端数据同步方法、装置、设备及介质
CN114978786B (zh) 一种将第三方接口转化为系统标准接口的方法及装置
CN111258777B (zh) 传输语音数据的方法、装置、系统、设备、及存储介质
CN116467178B (zh) 数据库检测方法、装置、电子设备和计算机可读介质
CN111028848B (zh) 压缩语音处理方法、装置及电子设备
CN111625524A (zh) 数据处理方法、装置、设备及存储介质
CN117688097A (zh) 数据同步方法、装置、设备及可读存储介质
CN116708320A (zh) 一种网络隔离下的输入方法、装置、存储介质和电子设备
CN116166704A (zh) 提升电力客户关系库推送模型准确率的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant