CN108965562B - 语音数据生成方法及相关装置 - Google Patents

语音数据生成方法及相关装置 Download PDF

Info

Publication number
CN108965562B
CN108965562B CN201810816821.0A CN201810816821A CN108965562B CN 108965562 B CN108965562 B CN 108965562B CN 201810816821 A CN201810816821 A CN 201810816821A CN 108965562 B CN108965562 B CN 108965562B
Authority
CN
China
Prior art keywords
voice data
microphone
data
preset
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810816821.0A
Other languages
English (en)
Other versions
CN108965562A (zh
Inventor
郑志勇
柳明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oppo Chongqing Intelligent Technology Co Ltd
Original Assignee
Oppo Chongqing Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oppo Chongqing Intelligent Technology Co Ltd filed Critical Oppo Chongqing Intelligent Technology Co Ltd
Priority to CN201810816821.0A priority Critical patent/CN108965562B/zh
Publication of CN108965562A publication Critical patent/CN108965562A/zh
Application granted granted Critical
Publication of CN108965562B publication Critical patent/CN108965562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/24Arrangements for testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/6505Recording arrangements for recording a message from the calling party storing speech in digital form
    • H04M1/651Recording arrangements for recording a message from the calling party storing speech in digital form with speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/656Recording arrangements for recording a message from the calling party for recording conversations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种语音数据生成方法及相关装置,应用于电子设备,所述电子设备包括麦克风和红外线传感器,包括:电子设备通过红外线传感器采集的目标图像确定麦克风被堵塞,当检测到第一语音数据的获取指令时,通过麦克风获取第一语音数据,将第一语音数据输入第一预设模型生成目标语音数据,第一预设模型用于预测第一语音数据的数据缺失片段。本申请有利于提高电子设备进行语音数据生成的准确性和智能性。

Description

语音数据生成方法及相关装置
技术领域
本申请涉及电子技术领域,尤其涉及一种语音数据生成方法及相关装置。
背景技术
随着智能终端(如智能手机等)技术的迅速发展,以及越来越普及,现已成为用户日常生活中不可缺少的电子产品。在越来越便利的通信中,人们已经不单进行短信、电话,还会使用其他通信方式,例如通过微信发送语音或进行视频通话等操作,在收录语音时,未免会受到各种因素的影响而造成语音缺失,进而使得通信受到影响。
发明内容
本申请实施例提供一种语音数据生成方法及相关装置,提供一种语音生成方法,有利于提高电子设备进行语音数据生成的准确性和智能性。
第一方面,本申请实施例提供一种语音数据生成方法,应用于电子设备,所述电子设备包括麦克风和红外线传感器,所述方法包括:
通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
将所述第一语音数据输入第一预设模型生成所述目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
第二方面,本申请实施例提供一种语音数据生成装置,应用于电子设备,所述电子设备包括麦克风和红外线传感器,所述语音数据生成装置包括确定单元、获取单元和生成单元,其中,
所述确定单元,用于通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
所述获取单元,用于当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
所述生成单元,用于将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
可以看出,在本申请实施例中,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本申请实施例提供的一种电子设备的结构示意图;
图2是本申请实施例提供的一种语音数据生成方法的流程示意图;
图3是本申请实施例公开的另一种语音数据生成方法的流程示意图;
图4是本申请实施例公开的另一种语音数据生成方法的流程示意图;
图5是本申请实施例公开的一种电子设备的结构示意图;
图6是本申请实施例公开的一种语音数据生成装置的功能单元组成框图。
具体实现方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
以下分别进行详细说明。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备(例如智能手表、智能手环、计步器等)、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminal device)等等。为方便描述,上面提到的设备统称为电子设备。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例提供的一种电子设备100的结构示意图,上述电子设备100包括:壳体110、设置于所述壳体110内的电路板120、设置于所述壳体110上的显示屏130和麦克风140,所述电路板120上设置有处理器121,所述处理器121连接所述显示屏130。
下面对本申请实施例进行详细介绍。
请参阅图2,图2是本申请实施例提供了一种语音数据生成方法的流程示意图,应用于电子设备,所述电子设备包括麦克风和红外线传感器,本语音数据生成方法包括:
S201,电子设备通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞。
其中,红外线传感器通过热成像原理,可产生整个目标红外辐射的分布图像,可用于双麦克风机型(电子设备顶部副麦克风降噪和电子设备底部主麦克风收音)。
其中,麦克风堵孔是指电子设备的用于麦克风采集声音的通孔处于堵塞状态,如被灰尘、水等介质堵塞或手指堵塞等,此处不做唯一限定。
S202,所述电子设备当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据。
其中,第一语音数据可以包括但不限于音色、音量、音频等,此处不做唯一限定。
S203,所述电子设备将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
其中,预设模型为智能模型,智能模型包含有多种算法,可根据多种算法预测所述第一语音数据的数据缺失片段。
可以看出,本申请实施例中,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
在一个可能的示例中,所述通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,包括:电子设备通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像;将所述目标图像与预设图像进行匹配,得到匹配值;若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
其中,预设匹配值可为用户自行设定或在出厂时,厂商自行设定,此处不做唯一限定。
其中,预设图像可以为在历史数据中,麦克风被堵塞时采集的图像或通过模拟器模型的图像,此处不做唯一限定。
可见,本示例中,电子设备可通过红外线传感器采集的图像,准确的判断当前的麦克风是否被堵塞,提高了电子设备在进行确定麦克风堵塞时的准确性和智能性。
在一个可能的示例中,所述将所述第一语音数据输入预设模型生成目标语音数据,包括:电子设备通过所述预设模型确定所述第一语音数据的完整度;当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字;根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据;根据所述第二语音数据和所述第一语音数据生成目标语音数据。
可见,本示例中,电子设备可通过预设模型,对收录的语音进行检测,进而准确的判断出该语音是否有缺失的部分,若有,进一步的根据预设模型模拟出缺失的语音,最终形成完整的语音,有利于提高电子设备在进行收录语音判断时的准确性,并提高了电子设备在进行语音数据生成时的智能性。
在一个可能的示例中,所述通过所述预设模型确定所述第一语音数据的完整度,包括:电子设备将所述第一语音数据进行滤波处理,得到所述滤波处理后的所述第一语音数据的多个振幅参数;在所述多个振幅参数中筛选出低于预设振幅参数的至少一个目标振幅参数;根据所述至少一个目标振幅参数在所述多个振幅参数中的占比,得到所述第一语音数据的完整度。
其中,滤波处理为将收录的语音进行降噪和过滤处理,以得到清晰的语音。
可见,本示例中,电子设备可通过对收录的语音的滤波处理,得到多个参数,进一步的根据参数确定收录的语音完整度,避免因收录的语音中含有噪音,而导致误判的情况发生,有利于提高电子设备在进行语音数据生成时的智能性和准确性。
在一个可能的示例中,所述根据所述关键字确定所述数据缺失片段的第二语音数据,包括:电子设备获取所述至少一个关键词的第一类别;查询所述第一类别所属的预设数据库,所述预设数据库存储有所述第一类别关联的语音数据;获取当前的目标时间参数;在所述预设数据库中,筛选出与所述目标时间参数匹配的目标语音数据,所述目标语音数据为所述数据缺失片段的第二语音数据。
其中,类别是关键词中不同的种类或按种类不同而做出的区别。
其中,预设数据库存储的所述第一类别关联的语音数据,每条语音数据上都有对应的时间标识,根据所述时间标识,在任一时间内,能准确的找到对应的语音数据。
可见,本示例中,电子设备根据关键词的类别,得到对应的语音数据库,进一步的根据当前的时间,得到在该数据库中与时间对应的语音数据,通过两次匹配,能够准确的定位出当前缺失语音的场景,有利于电子设备进行确定语音缺失数据时的准确定和智能性。
在另一种具体实现方式中,电子设备还包括传输孔,所述传输孔连接所述麦克风和所述红外线传感器,所述红外线传感器通过所述传输孔将第一红外线信号发射,在接收时,通过预设角度,将所述第一红外线信号通过传输孔反射接收,得到第二红外线信号,检测所述第二红外线信号的信号强度,若所述第二红外信号的信号强度低于预设信号强度,则确定所述麦克风被堵塞。
其中,红外线信号反射后,产生了多个反射信号,通过预设角度,能够采集到通过传输孔的反射信号,预设角度可以为出厂时,厂商自行设定,此处不做唯一限定。
可见,本示例中,电子设备通过传输孔进行红外线的发送和接收,进一步的检测接收的信号的信号强度,通过对信号强度的判断,进而确定麦克风被堵塞,提高了电子设备在进行麦克风堵塞检测时的准确性和智能性。
与所述图2所示的实施例一致的,请参阅图3,图3是本申请实施例提供的一种语音数据生成方法的流程示意图,应用于电子设备。所述电子设备包括麦克风和红外线传感器,如图所示,本语音数据生成方法包括:
S301,电子设备通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像。
S302,所述电子设备将所述目标图像与预设图像进行匹配,得到匹配值。
S303,所述电子设备若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
S304,所述电子设备当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据。
S305,所述电子设备通过所述预设模型确定所述第一语音数据的完整度。
S306,所述电子设备当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字。
S307,所述电子设备根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据。
S308,所述电子设备根据所述第二语音数据和所述第一语音数据生成目标语音数据。
可以看出,本申请实施例中,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
此外,电子设备可通过红外线传感器采集的图像,准确的判断当前的麦克风是否被堵塞,提高了电子设备在进行确定麦克风堵塞时的准确性和智能性。
此外,电子设备可通过预设模型,对收录的语音进行检测,进而准确的判断出该语音是否有缺失的部分,若有,进一步的根据预设模型模拟出缺失的语音,最终形成完整的语音,有利于提高电子设备在进行收录语音判断时的准确性,并提高了电子设备在进行语音数据生成时的智能性。
此外,电子设备可通过对收录的语音的滤波处理,得到多个参数,进一步的根据参数确定收录的语音完整度,避免因收录的语音中含有噪音,而导致误判的情况发生,有利于提高电子设备在进行语音数据生成时的智能性和准确性。
此外,电子设备根据关键词的类别,得到对应的语音数据库,进一步的根据当前的时间,得到在该数据库中与时间对应的语音数据,通过两次匹配,能够准确的定位出当前缺失语音的场景,有利于电子设备进行确定语音缺失数据时的准确定和智能性。
与所述图2所示的实施例一致的,请参阅图4,图4是本申请实施例提供的一种语音数据生成方法的流程示意图,应用于电子设备,所述电子设备包括麦克风和红外线传感器。如图所示,本语音数据生成方法包括:
S401,电子设备通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞。
S402,所述电子设备当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据。
S403,所述电子设备将所述第一语音数据进行滤波处理,得到所述滤波处理后的所述第一语音数据的多个振幅参数。
S404,所述电子设备在所述多个振幅参数中筛选出低于预设振幅参数的至少一个目标振幅参数;
S405,所述电子设备根据所述至少一个目标振幅参数在所述多个振幅参数中的占比,得到所述第一语音数据的完整度。
S406,所述电子设备当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字。
S407,所述电子设备获取所述至少一个关键词的第一类别。
S408,所述电子设备查询所述第一类别所属的预设数据库,所述预设数据库存储有所述第一类别关联的语音数据。
S409,所述电子设备获取当前的目标时间参数。
S410,所述电子设备在所述预设数据库中,筛选出与所述目标时间参数匹配的目标语音数据,所述目标语音数据为所述数据缺失片段的第二语音数据。
S411,所述电子设备根据所述第二语音数据和所述第一语音数据生成所述目标语音数据。
可以看出,本申请实施例,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
此外,电子设备可通过预设模型,对收录的语音进行检测,进而准确的判断出该语音是否有缺失的部分,若有,进一步的根据预设模型模拟出缺失的语音,最终形成完整的语音,有利于提高电子设备在进行收录语音判断时的准确性,并提高了电子设备在进行语音数据生成时的智能性。
此外,电子设备可通过对收录的语音的滤波处理,得到多个参数,进一步的根据参数确定收录的语音完整度,避免因收录的语音中含有噪音,而导致误判的情况发生,有利于提高电子设备在进行语音数据生成时的智能性和准确性。
此外,电子设备根据关键词的类别,得到对应的语音数据库,进一步的根据当前的时间,得到在该数据库中与时间对应的语音数据,通过两次匹配,能够准确的定位出当前缺失语音的场景,有利于电子设备进行确定语音缺失数据时的准确定和智能性。
此外,电子设备可通过红外线传感器采集的图像,准确的判断当前的麦克风是否被堵塞,提高了电子设备在进行确定麦克风堵塞时的准确性和智能性。
与所述图2、图3、图4所示的实施例一致的,请参阅图5,图5是本申请实施例提供的一种电子设备500的结构示意图,如图所示,所述电子设备500包括应用处理器510、存储器520、通信接口530以及一个或多个程序521,其中,所述一个或多个程序521被存储在上述存储器520中,并且被配置由上述应用处理器510执行,所述一个或多个程序521包括用于执行以下步骤的指令;
通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
可以看出,本申请实施例中,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
在一个可能的示例中,在所述通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞方面,所述程序中的指令具体用于执行以下操作:通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像;将所述目标图像与预设图像进行匹配,得到匹配值;若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
在一个可能的示例中,在所述将所述第一语音数据输入预设模型生成目标语音数据方面,所述程序中的指令具体用于执行以下操作:通过所述预设模型确定所述第一语音数据的完整度;当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字;根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据;根据所述第二语音数据和所述第一语音数据生成目标语音数据。
在一个可能的示例中,在所述通过所述预设模型确定所述第一语音数据的完整度方面,所述程序中的指令具体用于执行以下操作:将所述第一语音数据进行滤波处理,得到所述滤波处理后的所述第一语音数据的多个振幅参数;在所述多个振幅参数中筛选出低于预设振幅参数的至少一个目标振幅参数;根据所述至少一个目标振幅参数在所述多个振幅参数中的占比,得到所述第一语音数据的完整度。
在一个可能的示例中,在所述根据所述关键字确定所述数据缺失片段的第二语音数据方面,所述程序中的指令具体用于执行以下操作:获取所述至少一个关键词的第一类别;查询所述第一类别所属的预设数据库,所述预设数据库存储有所述第一类别关联的语音数据;获取当前的目标时间参数;在所述预设数据库中,筛选出与所述目标时间参数匹配的目标语音数据,所述目标语音数据为所述数据缺失片段的第二语音数据。
上述实施例主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据所述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例所实现的方法。如图6所示的语音数据生成装置600,应用于电子设备,所述电子设备包括麦克风和红外线传感器,所述语音数据生成装置600包括确定单元601、获取单元602和生成单元603,其中,
所述确定单元,用于通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
所述获取单元,用于当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
所述生成单元,用于将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
可以看出,本申请实施例中,电子设备首先通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,其次,当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据,最后,将所述第一语音数据输入第一预设模型生成目标语音数据,所述第一预设模型用于预测所述第一语音数据的数据缺失片段。可见,电子设备可根据红外线传感器采集的数据进行分析,进一步的判断出麦克风是否被堵塞,进而在收录完语音数据后,对收录语音中的缺失信息通过智能模型进行还原,得到完整的语音数据,避免了因语音数据缺失而造成的误处理的情况,有利于提高电子设备在进行语音数据生成过程中的智能性和准确性。
在一个可能的示例中,在所述通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞方面,所述确定单元601具体用于:通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像;将所述目标图像与预设图像进行匹配,得到匹配值;若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
在一个可能的示例中,在所述将所述第一语音数据输入预设模型生成目标语音数据方面,所述生成单元603具体用于:通过所述预设模型确定所述第一语音数据的完整度;当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字;根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据;根据所述第二语音数据和所述第一语音数据生成目标语音数据。
在一个可能的示例中,在所述通过所述预设模型确定所述第一语音数据的完整度方面,所述生成单元603具体用于:将所述第一语音数据进行滤波处理,得到所述滤波处理后的所述第一语音数据的多个振幅参数;在所述多个振幅参数中筛选出低于预设振幅参数的至少一个目标振幅参数;根据所述至少一个目标振幅参数在所述多个振幅参数中的占比,得到所述第一语音数据的完整度。在一个可能的示例中,在所述根据所述关键字确定所述数据缺失片段的第二语音数据方面,所述生成单元603具体用于:获取所述至少一个关键词的第一类别;查询所述第一类别所属的预设数据库,所述预设数据库存储有所述第一类别关联的语音数据;获取当前的目标时间参数;在所述预设数据库中,筛选出与所述目标时间参数匹配的目标语音数据,所述目标语音数据为所述数据缺失片段的第二语音数据。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种语音数据生成方法,其特征在于,应用于电子设备,所述电子设备包括麦克风和红外线传感器,所述方法包括:
通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
将所述第一语音数据输入第一预设模型生成目标语音数据,包括:通过所述预设模型确定所述第一语音数据的完整度;当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字;根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据;根据所述第二语音数据和所述第一语音数据生成目标语音数据;所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
2.根据权利要求1所述的方法,其特征在于,所述通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞,包括:
通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像;
将所述目标图像与预设图像进行匹配,得到匹配值;
若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
3.根据权利要求1所述的方法,其特征在于,所述通过所述预设模型确定所述第一语音数据的完整度,包括:
将所述第一语音数据进行滤波处理,得到所述滤波处理后的所述第一语音数据的多个振幅参数;
在所述多个振幅参数中筛选出低于预设振幅参数的至少一个目标振幅参数;
根据所述至少一个目标振幅参数在所述多个振幅参数中的占比,得到所述第一语音数据的完整度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述关键字确定所述数据缺失片段的第二语音数据,包括:
获取所述至少一个关键字的第一类别;
查询所述第一类别所属的预设数据库,所述预设数据库存储有所述第一类别关联的语音数据;
获取当前的目标时间参数;
在所述预设数据库中,筛选出与所述目标时间参数匹配的目标语音数据,所述目标语音数据为所述数据缺失片段的第二语音数据。
5.一种语音数据生成装置,其特征在于,应用于电子设备,所述电子设备包括麦克风和红外线传感器,所述语音数据生成装置包括确定单元、获取单元和生成单元,其中,
所述确定单元,用于通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞;
所述获取单元,用于当检测到第一语音数据的获取指令时,通过所述麦克风获取所述第一语音数据;
所述生成单元,用于将所述第一语音数据输入第一预设模型生成目标语音数据,包括:通过所述预设模型确定所述第一语音数据的完整度;当所述完整度小于预设完整度时,提取所述第一语音数据中的关键字;根据所述关键字确定所述第一语音数据的数据缺失片段的第二语音数据;根据所述第二语音数据和所述第一语音数据生成目标语音数据;所述第一预设模型用于预测所述第一语音数据的数据缺失片段。
6.根据权利要求5所述的装置,其特征在于,在所述通过所述红外线传感器采集的目标图像确定所述麦克风被堵塞方面,所述确定单元具体用于:
通过所述红外线传感器采集目标图像,所述目标图像为所述麦克风区域的图像;
将所述目标图像与预设图像进行匹配,得到匹配值;
若所述匹配值大于预设匹配值,则确定所述麦克风被堵塞。
7.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-4任一项所述的方法中的步骤的指令。
8.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-4任一项所述的方法。
CN201810816821.0A 2018-07-24 2018-07-24 语音数据生成方法及相关装置 Active CN108965562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810816821.0A CN108965562B (zh) 2018-07-24 2018-07-24 语音数据生成方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810816821.0A CN108965562B (zh) 2018-07-24 2018-07-24 语音数据生成方法及相关装置

Publications (2)

Publication Number Publication Date
CN108965562A CN108965562A (zh) 2018-12-07
CN108965562B true CN108965562B (zh) 2021-04-13

Family

ID=64463664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810816821.0A Active CN108965562B (zh) 2018-07-24 2018-07-24 语音数据生成方法及相关装置

Country Status (1)

Country Link
CN (1) CN108965562B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112600975B (zh) * 2019-09-16 2022-03-11 北京小米移动软件有限公司 目标孔堵塞的检测方法、检测装置及移动终端
CN112583865A (zh) * 2019-09-27 2021-03-30 阿里巴巴集团控股有限公司 一种控制方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015196411A1 (en) * 2014-06-26 2015-12-30 Intel Corporation Beamforming audio with wearable device microphones
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN107393544A (zh) * 2017-06-19 2017-11-24 维沃移动通信有限公司 一种语音信号修复方法及移动终端
CN107564533A (zh) * 2017-07-12 2018-01-09 同济大学 基于信源先验信息的语音帧修复方法和装置
CN107678793A (zh) * 2017-09-14 2018-02-09 珠海市魅族科技有限公司 语音助手启动方法及装置、终端及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015196411A1 (en) * 2014-06-26 2015-12-30 Intel Corporation Beamforming audio with wearable device microphones
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106653041A (zh) * 2017-01-17 2017-05-10 北京地平线信息技术有限公司 音频信号处理设备、方法和电子设备
CN107393544A (zh) * 2017-06-19 2017-11-24 维沃移动通信有限公司 一种语音信号修复方法及移动终端
CN107564533A (zh) * 2017-07-12 2018-01-09 同济大学 基于信源先验信息的语音帧修复方法和装置
CN107678793A (zh) * 2017-09-14 2018-02-09 珠海市魅族科技有限公司 语音助手启动方法及装置、终端及计算机可读存储介质

Also Published As

Publication number Publication date
CN108965562A (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
WO2019233212A1 (zh) 文本识别方法、装置、移动终端以及存储介质
CN109241908A (zh) 人脸识别方法及相关装置
CN105917246B (zh) 无需测距的接近度确定
CN105205494B (zh) 相似图片识别方法及装置
CN108668077A (zh) 摄像头控制方法、装置、移动终端及计算机可读介质
CN105069426B (zh) 相似图片判断方法以及装置
WO2021136975A1 (en) Image processing methods and apparatuses, electronic devices, and storage media
CN109493852A (zh) 一种语音识别的评测方法及装置
CN111343558B (zh) 麦克风堵孔检测方法及相关产品
CN109117725A (zh) 人脸识别方法及装置
CN110321863A (zh) 年龄识别方法及装置、存储介质
CN109146498A (zh) 人脸支付方法及相关装置
CN109196815A (zh) 信道占用信息的确定方法和装置
CN109493883A (zh) 一种智能设备及其智能设备的音频时延计算方法和装置
CN108965562B (zh) 语音数据生成方法及相关装置
CN104601204B (zh) 触发条件检测方法及装置
CN109065017B (zh) 语音数据生成方法及相关装置
CN106027801A (zh) 一种通信消息的处理方法及装置、移动设备
CN109121042B (zh) 语音数据处理方法及相关产品
CN109740520B (zh) 指纹识别方法及相关设备
CN104484112A (zh) 一种工作模式的切换方法及终端
CN109062648B (zh) 信息处理方法、装置、移动终端及存储介质
CN109190448A (zh) 人脸识别方法及装置
CN108960213A (zh) 目标跟踪方法、装置、存储介质及终端
CN111161759B (zh) 音频质量评价方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant