CN110136724A - 一种数据处理方法及终端设备 - Google Patents

一种数据处理方法及终端设备 Download PDF

Info

Publication number
CN110136724A
CN110136724A CN201910365324.8A CN201910365324A CN110136724A CN 110136724 A CN110136724 A CN 110136724A CN 201910365324 A CN201910365324 A CN 201910365324A CN 110136724 A CN110136724 A CN 110136724A
Authority
CN
China
Prior art keywords
voice
content
speech recognition
paraphrase
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910365324.8A
Other languages
English (en)
Inventor
段俊宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Shenzhen Co Ltd
Original Assignee
Communication Software Co Ltd Of Dongguan City Bubukao
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication Software Co Ltd Of Dongguan City Bubukao filed Critical Communication Software Co Ltd Of Dongguan City Bubukao
Priority to CN201910365324.8A priority Critical patent/CN110136724A/zh
Publication of CN110136724A publication Critical patent/CN110136724A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种数据处理方法及终端设备,其中方法包括:接收用户输入的第一语音;调用语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。这样,本发明实施例在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。

Description

一种数据处理方法及终端设备
技术领域
本发明涉及终端设备技术领域,尤其涉及一种数据处理方法及终端设备。
背景技术
随着电子技术的不断发展,语音识别技术的应用越来越广泛,越来越多的终端设备支持通过语音输入实现对应的操作,用户输入语音就能实现对终端设备的控制,能够给用户提供极大的方便。
然而,现有技术中,语音识别通常仅针对普通话,这样一来,对于普通话不标准(例如口音比较重)或者不会说普通话的人群而言,语音识别的成功率较低,给用户造成不便。
发明内容
本发明实施例提供一种数据处理方法及终端设备,以解决现有技术中语音识别的成功率较低,给用户造成不便的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种数据处理方法,应用于终端设备,所述方法包括:
接收用户输入的第一语音;
调用语音识别数据库对所述第一语音进行语音识别;
若语音识别失败,获取第一释义内容;
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
第二方面,本发明实施例提供了一种终端设备,所述终端设备包括:
接收模块,用于接收用户输入的第一语音;
调用模块,用于调用语音识别数据库对所述第一语音进行语音识别;
获取模块,用于若语音识别失败,获取第一释义内容;
更新模块,用于将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
第三方面,本发明实施例提供了另一种终端设备,包括处理器,存储器,存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述数据处理方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理方法的步骤。
本发明实施例中,所述数据处理方法接收用户输入的第一语音;调用语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。这样,本发明实施例在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例提供的数据处理方法的流程图之一;
图2是本发明实施例提供的数据处理方法的流程图之二;
图3是本发明实施例提供的终端设备的结构图之一;
图4是本发明实施例提供的终端设备的结构图之二;
图5是本发明实施例提供的终端设备的结构图之三;
图6是本发明实施例提供的终端设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的数据处理方法的流程图之一,所述数据处理方法应用于终端设备,如图1所示,包括以下步骤:
步骤101、接收用户输入的第一语音。
该步骤中,所述终端设备接收用户输入的第一语音,可以理解的是,当用户需要对所述终端设备进行语音控制时,输入第一语音。相应地,所述终端设备接收用户输入的所述第一语音。
步骤102、调用语音识别数据库对所述第一语音进行语音识别。
该步骤中,所述终端设备调用语音识别数据库对所述第一语音进行语音识别。所述语音识别数据库包括多个语音以及每个语音对应的释义内容,所述调用语音识别数据库对所述第一语音进行语音识别具体可以包括:查找所述语音识别数据库中是否包括与所述第一语音匹配的语音,若存在与所述第一语音匹配的语音,则语音识别成功;相反地,若不存在与所述第一语音匹配的语音,则语音识别失败。
所述语音识别数据库可以为所述终端设备上预先存储的语音识别数据库,也可以为所述终端设备从其他设备(例如服务器)获取的语音识别数据库。所述语音识别数据库可以包括多种不同语言类型的语音,也可以仅包括所述第一语音的语言类型对应的语音。
在本发明一些实施例中,所述终端设备可以从多个语音识别数据库中获取目标语音数据库,然后调用所述目标语音数据库对所述第一语音进行语音识别,其中,所述目标语音数据库包括所述第一语音的语言类型对应的语音。具体地,所述终端设备在接收到所述第一语音后,可以先确定所述第一语音的语言类型,然后将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库。所述语言类型可以包括以下的一种或多种:不同地区的方言、普通话、不同国家的语言。
步骤103、若语音识别失败,获取第一释义内容。
该步骤中,若语音识别失败,所述终端设备获取第一释义内容,所述第一释义内容可以包括文字内容,也可以包括语音内容,本发明实施例对此不做具体限定。
所述终端设备可以在对所述第一语音进行语音识别失败后,在所述终端设备提供用户接口,供用户输入内容,所述终端设备根据用户输入的内容确定第一释义内容。具体地,用户可以输入文字内容,相应地,所述终端设备将用户输入的文字内容作为第一释义内容;用户也可以输入语音,相应地,所述终端设备可以直接将用户输入的语音作为第一释义内容,也可以将用户输入的语音转化成文字内容,并将转化成的文字内容作为第一释义内容。本发明实施例中,用户输入的语音的语言类型可以为语音识别成功率较高的语言类型,(例如普通话),这样,所述终端设备能够更加准确地确定第一释义内容。
步骤104、将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
该步骤中,所述终端设备将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。具体地,在所述终端设备预先存储所述语音识别数据库的情况下,所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库具体包括:在所述语音识别数据库中添加所述第一语音以及所述第一语音对应的释义内容。在所述终端设备从服务器获取所述语音识别数据库的情况下,所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库具体包括:向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述目标语音识别数据库。
举例而言,当用户输入的第一语音为方言或者带口音的普通话,且所述终端设备无法对其进行成功识别时,所述终端设备获取第一释义内容,并在所述语音识别数据库中添加所述第一语音以及所述第一语音对应的释义内容。这样,当用户下次输入与所述第一语音相同的语音时,所述终端设备能够从更新后的语音识别数据库中获取到对应的释义内容,从而能够成功进行语音识别,提高语音识别的成功率。
本发明实施例中,上述终端设备可以是移动终端设备,例如:手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、个人数字助理(personaldigital assistant,简称PDA)、移动上网装置(Mobile InternetDevice,MID)或可穿戴式设备(Wearable Device)、数码相机等;也可以是固定终端设备,例如计算机等。
本实施例中,所述数据处理方法接收用户输入的第一语音;调用语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。这样,所述数据处理方法在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。
可选地,所述获取第一释义内容,包括:
将用户输入的文字内容作为第一释义内容;
或者,将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音;
或者,接收用户输入的第三语音,将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
该实施例中,所述终端设备在对所述第一语音进行语音识别失败后,提供用户接口供用户输入内容,所述终端设备根据用户输入的内容确定所述第一语音对应的第一释义内容。所述第一释义内容可以为文字内容,也可以为语音内容。具体地,用户可以输入文字内容,相应地,所述终端设备将用户输入的文字内容作为所述第一释义内容。用户也可以输入语音,所述终端设备可以直接将用户输入的语音作为第一释义内容,也可以将用户输入的语音转化成的文字内容作为第一释义内容。
本发明实施例中,用户输入的语音为普通话语音,这样,能够有效提高所述第一释义内容的准确性。举例而言,所述终端设备可以将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音。所述终端设备也可以将用户输入的第三语音转化成文字内容,并将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
可选地,所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,包括:
向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。
该实施例中,所述终端设备从所述服务器获取语音识别数据库,所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,具体包括:向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。这样,当其他用户输入与所述第一语音相同的语音时,能够从更新后的语音识别数据库中获取到对应的释义内容,从而能够成功进行语音识别,提高语音识别的成功率。
可选地,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容;
所述方法还包括:
若待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述第一文字内容替换为所述第一文字内容对应的释义内容。
该实施例中,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容。具体地,用户可以根据个人使用习惯或者喜好设置不同词语之间的映射关系,并将所述映射关系存储至所述语音识别数据库中,
在进行语音识别时,所述终端设备可以判断待识别语音转化成的文字内容中是否包括所述至少一个文字内容中的第一文字内容,若所述待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述待识别语音转化成的文字内容中的第一文字内容替换成所述第一文字内容对应的释义内容。所述待识别语音可以包括所述第一语音,也可以包括其他待识别的语音。
举例而言,假设用户的好友甲的名字为“A”,且所述终端设备的通讯录中存储的名字也为“A”,而用户对好友甲的称呼为昵称“B”。用户可以“A”设置为“B”对应的释义内容。当用户输入的语音转化成文字内容为“打电话给B”时,所述终端设备将“B”替换为“A”,即确定的释义内容为“打电话给A”。这样,能够准确地响应用户的语音输入,给用户提供方便。
参见图2,图2是本发明实施例提供的数据处理方法的流程图之二,所述方法应用于终端设备,本实施例与上个实施例的主要区别在于本实施例中还进一步根据第一语音确定目标语音识别数据库,如图2所示,包括以下步骤:
步骤201、接收用户输入的第一语音。
该步骤201与本发明图1所示的实施例中的步骤101相同,此处不再赘述。
步骤202、确定所述第一语音的语言类型。
该步骤中,所述终端设备确定所述第一语音的语言类型,所述语言类型可以包括以下的一种或多种:多个不同地区的方言、普通话、不同国家的语言。本发明实施例中,用户可以直接输入所述第一语音的语言类型,具体地,用户可以在所述终端设备上执行第一输入,所述终端设备接收所述第一输入,并根据所述第一输入确定所述第一语音的语言类型。所述第一输入可以包括输入所述第一语音的语言类型的输入操作,也可以包括选择所述第一语音的语言类型的选择操作。用户也可以不输入所述第一语音的语言类型,所述终端设备可以根据所述第一语音确定所述第一语音的语言类型,例如可以根据所述第一语音的语音特征参数确定所述第一语音的语言类型。
步骤203、将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库。
该步骤中,所述终端设备将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库。
本发明实施例中,所述终端设备可以预先存储由多个不同的语言类型分别对应的语音识别数据库,所述终端设备接收到所述第一语音后,确定所述第一语音的语言类型,然后将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库。
本发明一些实施例中,所述终端设备可以在接收到所述第一语音后,确定所述第一语音的语言类型,并向服务器发送包含有所述第一语音的语言类型的获取请求,所述服务器响应于所述获取请求,向所述终端设备发送所述第一语音的语言类型对应的语音识别数据库,所述终端设备接收所述服务器发送的语音识别数据库,并将接收到的语音识别数据库确定为目标语音识别数据库。
本发明其他实施例中,所述终端可以在接收到所述第一语音后,向所述服务器发送所述第一语音,所述服务器接收所述第一语音,确定所述第一语音的语言类型,并向所述终端设备发送所述第一语音的语言类型对应的语音识别数据库,所述终端设备接收所述服务器发送的语音识别数据库,并将接收到的语音识别数据库确定为目标语音识别数据库。
步骤204、调用所述目标语音识别数据库对所述第一语音进行语音识别。
该步骤中,所述终端设备调用所述目标语音识别数据库对所述第一语音进行语音识别。调用语音识别数据库对接收到的语音进行语音识别已经在图1所示的实施例中的步骤102进行了描述,此处不再赘述。
步骤205、若语音识别失败,获取第一释义内容。
该步骤205与本发明图1所示的实施例中的步骤104相同,此处不再赘述。
步骤206、将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。
该步骤中,所述终端设备将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。具体地,所述终端设备在所述目标语音识别数据库中添加所述第一语音以及所述第一语音对应的释义内容。
举例而言,当用户输入的第一语音为方言或者带口音的普通话,且所述终端设备无法对其进行成功识别时,所述终端设备获取第一释义内容,并在所述所述第一语音的语言类型对应的语音识别数据库中添加所述第一语音以及所述第一语音对应的释义内容。这样,当用户下次输入与所述第一语音相同的语音时,所述终端设备能够从更新后的目标语音识别数据库中获取到对应的释义内容,从而能够成功进行语音识别,提高语音识别的成功率。
在所述终端设备预先存储所述目标语音识别数据库的情况下,所述终端设备在存储的目标语音识别数据库中添加所述第一语音和所述第一语音对应的第一释义内容。在所述终端设备从所述服务器获取所述目标语音识别数据库的情况下,所述终端设备向所述服务器发送所述第一语音和所述第一语音对应的第一释义内容,所述服务器接收所述第一语音和所述第一语音对应的第一释义内容,并在所述目标语音识别数据库中添加所述第一语音和所述第一语音对应的第一释义内容。
本实施例中,所述数据处理方法接收用户输入的第一语音;确定所述第一语音的语言类型;将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库;调用所述目标语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。这样,所述数据处理方法在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对相应的语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。
可选地,所述确定所述第一语音的语言类型,包括:
接收用户的第一输入,根据所述第一输入确定所述第一语音的语言类型;
或者,获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。
该实施例中,所述终端设备可以根据用户的第一输入确定所述第一语音的语言类型,也可以根据所述第一语音确定所述第一语音的语言类型,具体地,所述终端设备可以获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。所述语音特征参数可以包括发音特点和/或语调特点,所述发音特点包括语音中每一个字的读音特点,所述语调特点包括语音中间高低、快慢、轻重、停顿等各种变化的特点。
这样,调用所述第一语音对应的目标语音识别数据库对所述第一语音进行语音识别,能够减小语音识别的耗时,从而提高语音识别的效率。
本发明一些实施例中,所述终端设备可以先根据所述第一语音的语音特征参数,确定所述第一语音的语言类型,然后在所述终端设备上提供用户接口,供用户确认所述终端设备确定的第一语音的语言类型是否准确。这样,能够提高语言类型的确认准确性,从而能够在语音识别时进一步提高语音识别的成功率。
参见图3,图3是本发明实施例提供的终端设备的结构图之一,能实现上述实施例中数据处理方法的细节,并达到相同的效果。如图3所示,所述终端设备300包括:
接收模块301,用于接收用户输入的第一语音;
调用模块302,用于调用语音识别数据库对所述第一语音进行语音识别;
获取模块303,用于若语音识别失败,获取第一释义内容;
更新模块304,用于将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
可选地,所述获取模块303,具体用于:
将用户输入的文字内容作为第一释义内容;
或者,将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音;
或者,接收用户输入的第三语音,将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
可选地,参见图4,图4是本发明实施例提供的终端设备的结构示意图之二,如图4所示,所述终端设备300还包括:
第一确定模块305,用于确定第一语音的语言类型;
第二确定模块306,用于将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库;
所述调用模块302,具体用于:
调用所述目标语音识别数据库对所述第一语音进行语音识别;
所述更新模块304,具体用于:
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。
可选地,所述第一确定模块305,具体用于:
接收用户的第一输入,根据所述第一输入确定所述第一语音的语言类型;
或者,获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。
可选地,所述更新模块304,具体用于:
向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。
可选地,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容;
参见图5,图5是本发明实施例提供的终端设备的结构示意图之三,如图5所示,所述终端设备还包括:
替换模块307,用于若待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述第一文字内容替换为所述第一文字内容对应的释义内容。
本实施例中,所述终端设备接收用户输入的第一语音;调用语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。这样,所述终端在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。
图6为实现本发明各个实施例的一种终端设备的硬件结构示意图,如图6所示,该终端设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的终端设备结构并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端设备、可穿戴设备、以及计步器等。
其中,处理器610,用于:
接收用户输入的第一语音;
调用语音识别数据库对所述第一语音进行语音识别;
若语音识别失败,获取第一释义内容;
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
可选地,所述处理器610执行的获取第一释义内容,包括:
将用户输入的文字内容作为第一释义内容;
或者,将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音;
或者,接收用户输入的第三语音,将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
可选地,所述处理器610执行调用语音识别数据库对所述第一语音进行语音识别之前,还可实现如下步骤:
确定所述第一语音的语言类型;
将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库;
所述处理器610执行的调用语音识别数据库对所述第一语音进行语音识别,包括:
调用所述目标语音识别数据库对所述第一语音进行语音识别;
所述处理器610执行的将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,包括:
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。
可选地,所述处理器610执行的确定所述第一语音的语言类型,包括:
接收用户的第一输入,根据所述第一输入确定所述第一语音的语言类型;
或者,获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。
可选地,所述处理器610执行的所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,包括:
向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。
可选地,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容;
所述处理器610还可实现如下步骤:
若待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述第一文字内容替换为所述第一文字内容对应的释义内容。
本发明实施例中,所述终端设备接收用户输入的第一语音;调用语音识别数据库对所述第一语音进行语音识别;若语音识别失败,获取第一释义内容;将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。这样,在对第一语音识别失败时,获取所述第一语音对应的第一释义内容并更新语音数据库,能够根据用户输入的语音对语音数据库进行更新,从而能够提高语音识别的成功率,给用户带来方便。
应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
终端设备通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与终端设备600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。
终端设备600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在终端设备600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。
用户输入单元607可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现终端设备的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现终端设备的输入和输出功能,具体此处不做限定。
接口单元608为外部装置与终端设备600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端设备600内的一个或多个元件或者可以用于在终端设备600和外部装置之间传输数据。
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器610是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
终端设备600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,终端设备600包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种终端设备,包括处理器610,存储器609,存储在存储器609上并可在所述处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种数据处理方法,应用于终端设备,其特征在于,所述方法包括:
接收用户输入的第一语音;
调用语音识别数据库对所述第一语音进行语音识别;
若语音识别失败,获取第一释义内容;
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
2.如权利要求1所述的数据处理方法,其特征在于,所述获取第一释义内容,包括:
将用户输入的文字内容作为第一释义内容;
或者,将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音;
或者,接收用户输入的第三语音,将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
3.如权利要求1所述的数据处理方法,其特征在于,所述调用语音识别数据库对所述第一语音进行语音识别之前,所述方法还包括:
确定所述第一语音的语言类型;
将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库;
所述调用语音识别数据库对所述第一语音进行语音识别,包括:
调用所述目标语音识别数据库对所述第一语音进行语音识别;
所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,包括:
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。
4.如权利要求3所述的数据处理方法,其特征在于,所述确定所述第一语音的语言类型,包括:
接收用户的第一输入,根据所述第一输入确定所述第一语音的语言类型;
或者,获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。
5.如权利要求1所述的数据处理方法,其特征在于,所述将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库,包括:
向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。
6.如权利要求1所述的数据处理方法,其特征在于,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容;
所述方法还包括:
若待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述第一文字内容替换为所述第一文字内容对应的释义内容。
7.一种终端设备,其特征在于,所述终端设备包括:
接收模块,用于接收用户输入的第一语音;
调用模块,用于调用语音识别数据库对所述第一语音进行语音识别;
获取模块,用于若语音识别失败,获取第一释义内容;
更新模块,用于将所述第一释义内容作为所述第一语音对应的释义内容,更新所述语音识别数据库。
8.如权利要求7所述的终端设备,其特征在于,所述获取模块,具体用于:
将用户输入的文字内容作为第一释义内容;
或者,将用户输入的第二语音作为第一释义内容,其中,所述第二语音为普通话语音;
或者,接收用户输入的第三语音,将所述第三语音转化成的文字内容作为第一释义内容,其中,所述第三语音为普通话语音。
9.如权利要求7所述的终端设备,其特征在于,所述终端设备还包括:
第一确定模块,用于确定第一语音的语言类型;
第二确定模块,用于将所述第一语音的语言类型对应的语音识别数据库确定为目标语音识别数据库,其中,不同的语言类型对应不同的语音识别数据库;
所述调用模块,具体用于:
调用所述目标语音识别数据库对所述第一语音进行语音识别;
所述更新模块,具体用于:
将所述第一释义内容作为所述第一语音对应的释义内容,更新所述目标语音识别数据库。
10.如权利要求9所述的终端设备,其特征在于,所述第一确定模块,具体用于:
接收用户的第一输入,根据所述第一输入确定所述第一语音的语言类型;
或者,获取所述第一语音的语音特征参数,根据所述语音特征参数确定所述第一语音的语言类型。
11.如权利要求7所述的终端设备,其特征在于,所述更新模块,具体用于:
向服务器发送包含有所述第一语音和所述第一释义内容的更新请求,其中,所述更新请求用于请求所述服务器根据所述第一语音和所述第一释义内容更新所述语音识别数据库。
12.如权利要求7所述的终端设备,其特征在于,所述语音识别数据库中还包括至少一个文字内容和每个文字内容对应的释义内容;
所述终端设备还包括:
替换模块,用于若待识别语音转化成的文字内容包括所述至少一个文字内容中的第一文字内容,将所述第一文字内容替换为所述第一文字内容对应的释义内容。
13.一种终端设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的数据处理方法的步骤。
CN201910365324.8A 2019-04-30 2019-04-30 一种数据处理方法及终端设备 Pending CN110136724A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910365324.8A CN110136724A (zh) 2019-04-30 2019-04-30 一种数据处理方法及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910365324.8A CN110136724A (zh) 2019-04-30 2019-04-30 一种数据处理方法及终端设备

Publications (1)

Publication Number Publication Date
CN110136724A true CN110136724A (zh) 2019-08-16

Family

ID=67576041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910365324.8A Pending CN110136724A (zh) 2019-04-30 2019-04-30 一种数据处理方法及终端设备

Country Status (1)

Country Link
CN (1) CN110136724A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910890A (zh) * 2019-12-11 2020-03-24 微创(上海)网络技术股份有限公司 一种自然语言的识别处理方法及系统
CN111540359A (zh) * 2020-05-07 2020-08-14 上海语识信息技术有限公司 一种语音识别方法、装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李弼程: "《模式识别原理与应用》", 29 February 2008, 西安:西安电子科技大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910890A (zh) * 2019-12-11 2020-03-24 微创(上海)网络技术股份有限公司 一种自然语言的识别处理方法及系统
CN111540359A (zh) * 2020-05-07 2020-08-14 上海语识信息技术有限公司 一种语音识别方法、装置和存储介质

Similar Documents

Publication Publication Date Title
CN103578474B (zh) 一种语音控制方法、装置和设备
CN108470041A (zh) 一种信息搜索方法及移动终端
WO2021136159A1 (zh) 截屏方法及电子设备
CN109960813A (zh) 一种翻译方法、移动终端及计算机可读存储介质
CN109445894A (zh) 一种截图方法及电子设备
WO2021129732A1 (zh) 显示处理方法及电子设备
CN107633051A (zh) 桌面搜索方法、移动终端及计算机可读存储介质
CN108334272A (zh) 一种控制方法及移动终端
CN108989558A (zh) 终端通话的方法及装置
CN108196815A (zh) 一种通话声音的调节方法和移动终端
CN110046015A (zh) 应用分享方法及终端
JP7324949B2 (ja) アプリケーション共有方法、第1電子機器及びコンピュータ可読記憶媒体
CN108469968A (zh) 一种应用程序处理方法及移动终端
CN107765954B (zh) 一种应用程序图标更新方法、移动终端及服务器
CN108521501A (zh) 语音输入方法及移动终端
CN109726303A (zh) 一种图像推荐方法和终端
CN107992615A (zh) 一种网址推荐方法、服务器及终端
CN108009031A (zh) 一种应用程序的控制方法及移动终端
JP2021532492A (ja) 文字入力方法及び端末
CN107154262A (zh) 一种语音操作方法、装置和移动终端
CN110136724A (zh) 一种数据处理方法及终端设备
CN109992753A (zh) 一种翻译处理方法及终端设备
CN109284146A (zh) 一种轻应用开启方法及移动终端
CN109063076A (zh) 一种图片生成方法及移动终端
CN108459813A (zh) 一种搜索方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 523000 Second Floor, Building C, 255 Wushabugao Avenue, Chang'an Town, Dongguan City, Guangdong Province

Applicant after: Dongguan Bensheng Software Technology Co.,Ltd.

Address before: 523000 Second Floor, Building C, 255 Wushabugao Avenue, Chang'an Town, Dongguan City, Guangdong Province

Applicant before: DONGGUAN BBK COMMUNICATION SOFTWARE Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20201125

Address after: 518101 A Tower 2301-09, 2401-09, 2501-09, 2601-09, No. 99 Yifang Central North District, Haiwang Community, Xin'an Street, Baoan District, Shenzhen City, Guangdong Province

Applicant after: VIVO MOBILE COMMUNICATIONS (SHENZHEN) Co.,Ltd.

Address before: 523000 Second Floor, Building C, 255 Wushabugao Avenue, Chang'an Town, Dongguan City, Guangdong Province

Applicant before: Dongguan Bensheng Software Technology Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190816

RJ01 Rejection of invention patent application after publication