CN107665710A - 移动终端语音数据处理方法及装置 - Google Patents

移动终端语音数据处理方法及装置 Download PDF

Info

Publication number
CN107665710A
CN107665710A CN201610600179.3A CN201610600179A CN107665710A CN 107665710 A CN107665710 A CN 107665710A CN 201610600179 A CN201610600179 A CN 201610600179A CN 107665710 A CN107665710 A CN 107665710A
Authority
CN
China
Prior art keywords
result
voice command
user
command event
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610600179.3A
Other languages
English (en)
Other versions
CN107665710B (zh
Inventor
相奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pateo Network Technology Service Co Ltd
Original Assignee
Shanghai Pateo Network Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pateo Network Technology Service Co Ltd filed Critical Shanghai Pateo Network Technology Service Co Ltd
Priority to CN201610600179.3A priority Critical patent/CN107665710B/zh
Publication of CN107665710A publication Critical patent/CN107665710A/zh
Application granted granted Critical
Publication of CN107665710B publication Critical patent/CN107665710B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种移动终端语音数据处理方法及装置,所述方法包括:采集用户输入的语音数据;对所述语音数据进行识别;根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的被控电子设备的执行结果为执行成功;从所述第一历史语音控制事件中获取对应的历史控制指令,并将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。采用上述方案,可以提高语音识别性能。

Description

移动终端语音数据处理方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种移动终端语音数据处理方法及装置。
背景技术
随着车载电子设备的发展,车载电子设备的种类越来越多。例如,车载收音机、车载音乐播放器、车载视频播放器、车载通讯系统及车载导航装置等车载应用装置。车载应用装置的操控技术已经从之前的手动控制操作发展到语音控制操作。
现有语音控制技术中,在进行语音控制时,语音识别的响应速度较慢,成功率较低。
发明内容
本发明解决的技术问题是如何提高语音识别性能。
为解决上述技术问题,本发明实施例提供一种移动终端语音数据处理方法,包括:采集用户输入的语音数据;对所述语音数据进行识别;根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的电子设备的执行结果为执行成功;从所述第一历史语音控制事件中获取对应的历史控制指令,并将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。
可选地,所述方法还包括:当从历史语音控制事件中,查找到与所述关键词及所述分类的结果相匹配的历史语音控制事件的数目超过一个时,获取当前采集用户输入语音数据的时间信息;将距离当前时间最近的历史语音控制事件作为所述第一历史语音控制事件。
可选地,所述方法还包括:当未查找到所述第一历史语音控制事件时,根据所述关键词及所述分类的结果生成当前控制指令,并将所述当前控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述当前控制指令对应的操作。
可选地,所述方法还包括:对所述历史语音控制事件进行统计分析,获取各历史语音控制事件对应的被控电子设备的执行结果;根据所述各历史语音控制事件对应的被控电子设备的执行结果,统计所述历史语音控制事件的执行成功率;将统计结果输出,以告知用户。
可选地,所述方法还包括:当所述历史语音控制事件对应的被控电子设备的执行结果为执行失败时,分析失败原因并输出,以告知用户;接收用户输入的修正数据,对预设的数据库进行修正。
可选地,当所述失败原因为未正确识别用户输入的语音数据时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:根据所述用户输入的语音数据确定用户所属地域;获取与所述用户所属地域对应的地方语音数据库;根据获取到的所述地方语音数据库,对预设语音数据库进行修正。
可选地,当所述失败原因为未搜索到与所述历史语音控制事件的第一关键词对应的结果时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:获取所述第一关键词的出现次数;判断所述第一关键词的出现次数是否超过预设第一阈值;当超过所述第一阈值时,将所述第一关键词及与所述第一关键词相关联的信息添加到预设的搜索数据库。
可选地,当所述失败原因为第一分类的结果不属于预设的分类数据库时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:获取所述第一分类的结果的出现次数;判断所述第一分类的结果的出现次数是否超过预设第二阈值;当超过所述第二阈值时,根据第一分类的结果对预设的分类数据库进行更新。
可选地,所述根据第一分类的结果对预设的分类数据库进行更新,包括:将所述第一分类的结果作为一个新的分类,并对预设的分类数据库进行更新;或,将所述第一分类的结果作为第二分类的结果的拓展词,并对预设的分类数据库进行更新。
可选地,当所述失败原因为搜索到的与所述历史语音控制事件的关键词对应的结果为错误结果时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:接收用户输入的对预设搜索算法的修正数据,并根据所述搜索算法的修正数据对所述预设搜索算法进行修正。
本发明实施还提供了一种移动终端语音数据处理装置,所述装置包括:采集单元,适于采集用户输入的语音数据;识别单元,适于对所述采集单元采集的所述语音数据进行识别;处理单元,适于根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;查找单元,适于从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的被控电子设备的执行结果为执行成功;获取单元,适于从所述第一历史语音控制事件中获取对应的历史控制指令;发送单元,适于将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
根据语音数据对应的关键词及分类的结果,从历史语音控制事件中查找与所述关键词及分类的结果相匹配的第一历史语音控制事件,从第一历史语音控制事件中获取对应的历史控制指令,并将历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行对应的操作。由于第一历史语音控制事件为执行成功的历史语音控制事件,使用第一历史语音控制事件对应的历史控制指令控制对应的被控电子设备,可以提高当前的语音控制事件的正确率,并有效的缩短语音控制过程所需时间,从而可以提高语音识别性能。
进一步,当历史语音控制事件对应的被控电子设备的执行结果为执行失败时,分析失败原因,并根据失败原因对预设的数据库进行修正。通过修正可以不断的完善预设的数据库,使得后续的语音识别更加准确,进一步提高语音识别性能。
此外,从历史语音控制事件的语音数据中,获取出现频率超过预设第二阈值的第一分类的结果,且出现频率超过预设第二阈值的第一分类的结果不属于预设的分类数据库,根据第一分类的结果对预设的分类数据库进行更新。通过不断的对分类数据库进行更新,可以提高分类的结果的准确性,从而可以提高语音识别性能。
附图说明
图1是本发明实施例中一种移动终端语音数据处理方法的流程图;
图2是本发明实施例中一种移动终端语音数据处理装置的结构示意图。
具体实施方式
现有语音控制技术中,在进行语音控制时,接收到用户输入的语音数据之后,需要对语音数据进行识别,获取语音数据对应的关键词,并将关键词发送至服务器。服务器根据接收到的关键词进行对应的搜索,并根据搜索结果生成对应的控制指令,控制电子设备执行对应的操作。在服务器进行搜索过程中,需要连接到通信网络,当通信网络信号不稳定的时候,会造成语音控制过程所需的时间较长。此外,在服务器根据关键词进行搜索的过程中,可能存在一个关键词对应多条搜索结果的情况,在这种情况下,最终获取到的结果可能并不是用户所需要的结果,从而导致语音识别以及语音控制的成功率较低。
在本发明实施例中,根据语音数据对应的关键词及分类的结果,从历史语音控制事件中查找与所述关键词及分类的结果相匹配的第一历史语音控制事件,从第一历史语音控制事件中获取对应的历史控制指令,并将历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行对应的操作。由于第一历史语音控制事件为执行成功的历史语音控制事件,使用第一历史语音控制事件对应的历史控制指令控制对应的被控电子设备,可以提高当前的语音控制事件的正确率,并有效的缩短语音控制过程所需时间,从而可以提高语音识别性能。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图1,本发明实施例提供一种移动终端语音数据处理方法,以下通过具体步骤进行详细说明。
步骤S11,采集用户输入的语音数据。
在具体实施中,可以通过预设的语音采集识别系统来采集用户输入的语音数据,预设的语音采集识别系统可以设置在移动终端中,也可以设置在其他终端中。
在具体实施中,移动终端可以为车载控制终端,也可以智能手机或平板电脑等便携式智能设备。车载控制终端可以与车载应用装置连接,以便与车载应用装置进行通信。车载应用装置可以为车载收音机、车载音乐播放器、车载导航装置、车载视频播放器、车载空调等。
例如,当用户需要打开车载收音机时,用户发出语音“打开收音机”,语音采集识别系统采集到用户输入的语音数据为“打开收音机”。
又如,当用户需要获取到达“金茂大厦”的导航路线时,用户发出语音“我要去金茂大厦”,语音采集识别系统采集到用户输入的语音数据为“我要去金茂大厦”。
步骤S12,对所述语音数据进行识别。
在具体实施中,当语音采集识别系统采集到用户输入的语音数据之后,可以通过预设的语音数据库对采集到的语音数据进行识别,并得到识别结果。
步骤S13,根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类。
在具体实施中,可以根据语音采集识别系统对采集到的语音数据的识别结果,获取语音数据对应的关键词;也可以根据识别结果获取被控电子设备的标识信息;还可以根据识别结果,按照语音数据中的用户的目的进行分类。
在本发明实施例中,关键词可以指与被控电子设备的属性相关联的,用于表达用户目的的词语,通常为名词。例如,被控电子设备为车载导航装置时,对应的关键词可以为:城市名、地名、路名、建筑物名、商店名、公司名等地理位置名词。又如,被控电子设备为车载收音机时,对应的关键词可以为:电台、FM、广播等。
在本发明实施例中,在对采集到的语音数据进行识别时,可以获取语音数据对应的关联词,根据所述关联词可以获取到与语音数据对应的被控电子设备的标识信息。关联词指与被控电子设备相关的名词或者动词。
例如,用户发出的语音为“打开收音机”。语音采集识别系统采集到用户输入的语音数据为“打开收音机”。语音采集识别系统对语音数据进行语音识别,获取到语音数据中的名词“收音机”。“收音机”可以为所述语音数据对应的关联词,通过关联词“收音机”可以获知被控电子设备的标识信息为“车载收音机”。
又如,用户发出的语音为“收听FM91.1”。语音采集识别系统采集到用户输入的语音数据为“收听FM91.1”,语音采集识别系统对语音数据进行语音识别,获取到语音数据对应的关键词为“FM91.1”,对应的关联词为“FM”,通过关联词“FM”可以获知被控电子设备的标识信息为“车载收音机”。
再如,用户发出的语音为“我要去金茂大厦”。语音采集识别系统采集到用户输入的语音数据为“我要去金茂大厦”,语音采集识别系统对语音数据进行语音识别,获取到语音数据对应的关键词为“金茂大厦”,语音数据中对应的关联词为动词“去”。通过关联词“去”可以获知被控电子设备的标识信息为“车载导航装置”。
再如,用户发出的语音为“调到26度”。语音采集识别系统采集到用户输入的语音数据为“调到26度”,语音采集识别系统对语音数据进行语音识别,获取到语音数据对应的关键词为“26度”,关联词为“度”。通过关联词“度”可以获知被控电子设备的标识信息为“车载空调”。此外,车载空调的标识信息的关联词还可以为:“空调”、“度”、“送风”、“制冷”等。可以理解的是,车载应用装置为车载空调时,当采集到的语音数据中涉及到温度时,关于温度的单位通常为用户所属国家的常用单位,例如,在中国通常使用的温度单位为摄氏度,在美国通常使用的温度单位为华氏度。具体用户可以根据需要自行设定。
在本发明实施例中,对所述语音数据中的用户的目的进行分类,可以根据语音数据中用于表达用户对关键词所要采取的动作的动词、限定词等,对用户的目的进行分类。
例如,语音数据为“我要去金茂大厦”,则在语音数据中,表示用户目的的动词为“去”,用户的目的为“我要去金茂大厦”,用户目的的分类的结果为“我要去”。又如,语音数据为“打开空调”,则在语音数据中,表示用户目的的动词为“打开”,用户的目的为“将空调打开”,用户目的的分类的结果为“打开”。再如,语音数据为“金茂大厦附近的咖啡馆”,则在语音数据中,表示用户目的的限定词为“附近的”,用户的目的为“查找金茂大厦附近的咖啡馆”,用户目的的分类的结果为“附近的”。
在具体实施中,在对用户的目的进行分类时,意思相近的动词可以对应同一个分类的结果;意思相近的限定词也可以对应同一个分类的结果。
例如,意思相近的动词“打开”、“开启”、“开开”等,对应同一分类的结果“打开”。又如,意思相近的限定词“周围的”、“附近的”、“旁边的”、“周边的”等,对应同一分类的结果“附近的”。
步骤S14,从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的语音控制事件。
在具体实施中,在每次语音控制事件完成之后,均可以将与语音控制事件相关的语音数据、关键词、分类的结果、被控电子设备的执行结果等信息进行保存,形成历史语音控制事件。历史语音控制事件的保存位置可以为云端服务器,也可以为本地存储器。
当历史语音控制事件的保存位置为云端服务器时,可以定期将保存在云端服务器上的历史语音控制事件下载到本地存储器;也可以根据接收到的用户输入的下载控制指令,将保存在云端服务器上的历史语音控制事件下载到本地存储器。
当历史语音控制事件的保存位置为本地存储器时,可以定期将保存在本地存储器上的历史语音控制事件上传至云端服务器;或者根据接收到的用户输入的上传控制指令,将保存在本地存储器上的历史语音控制事件上传至云端服务器,进行备份。
在具体实施中,在当前的语音控制事件中,获取到用户的语音数据对应的关键词和被控电子设备的标识信息,并对语音数据中的用户的目的进行分类后,可以根据获取到的所述关键词以及分类的结果,从历史语音控制事件中,查找与当前的语音控制事件的关键词以及分类的结果相匹配的第一历史语音控制事件。
在本发明实施例中,可以从所有的被控电子设备的执行结果为执行成功的历史语音控制事件中,查找与当前的语音控制事件的关键词以及分类的结果相匹配的第一历史语音控制事件。
例如,当前的语音控制事件中,用户输入的语音数据为“我要去金茂大厦”,从中可以获取到关键词为“金茂大厦”,分类的结果为“我要去”。根据“金茂大厦”和“我要去”从历史语音控制事件中查找与“金茂大厦”和“我要去”相匹配的第一历史语音控制事件,第一历史语音控制事件为“带我去金茂大厦”。
在本发明实施例中,在根据当前的语音控制事件的关键词以及分类的结果,在历史语音控制事件中进行查找时,可能会存在查找到多个与当前的语音控制事件的关键词以及分类的结果相匹配的历史语音控制事件。当查找到的相匹配的历史语音控制事件的个数为多个时,可以先获取执行当前的语音控制事件的起始时间,也即获取步骤S11中,当前采集用户输入的语音数据的时间信息。之后,根据当前的语音控制事件的时间信息,从查找到的相匹配的历史语音控制事件中,选择距离当前时间最近的历史语音控制事件作为第一历史语音控制事件。
例如,当前的语音控制事件中,用户输入的语音数据为“我要去金茂大厦”,从中可以获取到关键词为“金茂大厦”,分类的结果为“我要去”。根据“金茂大厦”和“我要去”从历史语音控制事件中查找到3个与“金茂大厦”和“我要去”相匹配的历史语音控制事件,查找到的3个历史语音控制事件分别为:“去金茂大厦”、“我要去金茂大厦”、“带我去金茂大厦”。获取到当前的语音控制事件的发生时间为2016年07月06日13:45:30,历史语音控制事件“去金茂大厦”的发生时间为2016年01月10日17:40:10,历史语音控制事件“我要去金茂大厦”的发生时间为2016年03月21日12:30:23,历史语音控制事件“带我去金茂大厦”的发生时间为2016年06月16日15:28:46。将距离当前的语音控制事件时间最近的“带我去金茂大厦”作为第一历史语音控制事件。
步骤S15,从所述第一历史语音控制事件中获取对应的历史控制指令,并将所述历史控制指令发送至与所述标识信息对应的被控电子设备。
在本发明实施例中,在查找到第一历史语音控制事件后,可以从所述第一历史语音控制事件中获取对应的历史控制指令,根据获取的被控电子设备的标识信息将所述历史控制指令发送至对应的被控电子设备。所述被控电子设备在接收到所述历史控制指令后,根据所述历史控制指令执行对应的操作。
例如,第一历史语音控制事件为“带我去金茂大厦”,从第一历史语音控制事件中获取对应的历史控制指令,历史控制指令为“我的位置至金茂大厦的导航路线”,将获取到的所述历史控制指令发送至车载导航装置。车载导航装置在接收到所述历史控制指令后,获取当前地理位置,并根据从历史控制指令中获取的金茂大厦的位置信息,生成导航路线。
由此可见,根据语音数据对应的关键词及分类的结果,从历史语音控制事件中查找与所述关键词及分类的结果相匹配的第一历史语音控制事件,从第一历史语音控制事件中获取对应的历史控制指令,并将历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行对应的操作。由于第一历史语音控制事件为执行成功的历史语音控制事件,使用第一历史语音控制事件对应的历史控制指令控制对应的被控电子设备,可以提高当前的语音控制事件的正确率,并有效的缩短语音控制过程所需时间,从而可以提高语音识别性能。
在具体实施中,当未查找到第一历史语音控制事件时,可以根据关键词及分类的结果生成当前控制指令,并将生成的所述当前控制指令发送至对应的被控电子设备。所述被控电子设备在接收到所述当前控制指令后,执行对应操作。
例如,在当前的语音控制事件中,用户发出的语音为“去自然博物馆”。语音采集识别系统采集到用户输入的语音数据为“去自然博物馆”,语音采集识别系统对采集到的语音数据进行语音识别,获取到语音数据对应的关键词为“自然博物馆”,分类的结果为“我要去”,关联词为“去”。根据关联词为“去”获知对应的被控电子设备的标识信息为“车载导航装置”。根据关键词“自然博物馆”和分类的结果“我要去”,从历史语音控制事件中并没有找到相匹配的第一历史语音控制事件。此时,可以通过全球定位系统获取用户当前所处的地理位置,然后根据关键词“自然博物馆”和分类的结果“我要去”,生成当前控制指令,当前控制指令为“当前所处地理位置至自然博物馆的导航路线”。车载导航装置根据生成的导航路线的控制指令,获取对应的导航路线。
在具体实施中,可以根据用户输入的语音数据,查找用户历史记录信息。
例如,在当前的语音控制事件中,用户发出的语音为“我曾经去过的咖啡馆”。语音采集识别系统采集到用户输入的语音数据为“我曾经去过的咖啡馆”。语音采集识别系统对语音数据进行语音识别,获取到语音数据对应的关键词为“咖啡馆”,分类的结果为“曾经去”。根据关键词“咖啡馆”和分类的结果为“曾经去”,从历史语音控制事件中查找与关键词“咖啡馆”相匹配的历史语音控制事件,从而可以获取到曾经去过的咖啡馆。
在本发明实施例中,可以对历史语音控制事件进行统计分析,获取各历史语音控制事件对应的被控电子设备的执行结果,并可以根据所述各历史语音控制事件对应的被控电子设备的执行结果统计历史语音控制事件的执行成功率。当得到统计结果之后,可以实时将统计结果输出,以使得用户可以实时获知统计结果;也可以在接收到用户输入的统计结果查询指令时,将统计结果输出。输出的统计结果可以为文字,也可以为语音,还可以为图片。可以理解的是,输出的统计结果可以采用文字、语音、图片的任意组合。例如,在输出文字的同时,进行语音播报。
例如,截止至当前时刻,共获取到50条历史语音控制事件。根据50条历史语音控制事件分别对应的被控电子设备的执行结果,获知45条历史语音控制事件的执行结果为执行成功,5条历史语音控制事件的执行结果为执行失败。则经计算可得知,历史语音控制事件的执行成功率为90%,向用户输出“语音识别成功率为90%”的字样。
在本发明实施例中,当历史语音控制事件的执行结果为执行失败时,可以对执行结果为执行失败的历史语音控制事件进行分析,得到失败原因,并将分析得到的失败原因输出,以使得用户获知失败原因。
在具体实施中,输出的失败原因可以为文字,也可以为语音,还可以为图片。可以理解的是,失败原因的输出可以采用文字、语音、图片的任意组合。例如,在输出文字的同时,进行语音播报。
在具体实施中,在获取到失败原因后,可以接收用户输入的修正数据,并可以根据修正数据对预设的语音数据库进行修正,从而在后续的语音数据识别过程中可以提高语音识别的准确率,进而提高语音数据识别性能。
在发明实施例中,当失败原因为未正确识别用户输入的语音数据时,可以根据用户输入的语音数据中用户的发音音色等确定用户所属地域。然后根据用户所属地域获取对应的地方语音数据库,并根据获取到的地方语音数据库,对预设的语音数据库进行修正。
例如,在对用户输入的语音数据进行识别过程中,由于用户发音带有地方口音,或者用户不会讲普通话,从而造成语音采集识别系统未能正确识别出用户输入的语音数据,可以根据用户发音音色等确定用户所属地域为成都,则可以获取到与成都对应的成都语音数据库,并将成都语音数据库添加到预设的语音数据库中。
在本发明实施例中,当失败原因为未搜索到与所述历史语音控制事件的第一关键词对应的结果时,可以判定预设的搜索数据库中不包括第一关键词。此时,可以获取并统计第一关键词出现的次数,并判断第一关键词出现的次数是否超过预设的第一阈值,当所述第一关键词出现的次数超过第一阈值时,获取第一关键词相关联的信息,并将第一关键词及第一关键词相关联的信息添加到预设的语音数据库。
例如,接收到用户输入的语音数据“去迪士尼”,在语音数据“去迪士尼”进行识别之后,获取第一关键词“迪士尼”以及分类的结果为“带我去”,对用户当前所处地理位置进行定位,获知用户目前所处地域为上海市。根据第一关键词“迪士尼”以及分类的结果“带我去”,从历史语音控制事件中,并没有查找到第一历史语音控制事件,从“去迪士尼”对应的历史语音控制事件对应的车载导航装置执行结果中得知失败原因为预设的搜索数据库中不包括第一关键词“迪士尼”。可以统计云端数据库中第一关键词“迪士尼”的出现的次数,当第一关键词“迪士尼”出现的次数超过10次时,获取“迪士尼”的位置信息、公交线路信息等相关信息,并将第一关键词“迪士尼”以及与“迪士尼”相关的信息更新到预设的搜索数据库中。
在本发明实施例中,失败原因为第一分类的结果不属于预设的分类数据库时,也即是在预设的分类数据库中不包括第一分类的结果。此时,可以获取并统计第一分类的结果的出现次数,并判断所述第一分类的结果的出现次数是否超过预设第二阈值,当超过所述第二阈值时,根据第一分类的结果对预设的分类数据库进行更新。
在具体实施中,当第一分类的结果与分类数据库中的所有分类的结果均不相关时,将第一分类的结果作为一个新的分类,并对预设的分类数据库进行更新。
例如,第一分类的结果为,第一分类的结果“附近的”与分类数据库中的所有分类的结果均与不相关,也即“附近的”不属于现有分类的结果,与现有的分类的结果不近似,与现有分类的结果的意思也不相同。将“附近的”作为一个新的分类,并将第一分类的结果更新至预设的分类数据库中。
在具体实施中,当第一分类的结果与分类数据库中的其中一个第二分类的结果相关时,将第一分类的结果作为第二分类的结果的拓展词,并对预设的分类数据库进行更新。
例如,当第一分类的结果为“旁边的”,第一分类的结果“旁边的”与第二分类的结果“附近的”词义相关,则将“旁边的”作为“附近的”拓展词,并对预设的分类数据库进行更新。当下次语音控制事件中的语音数据识别结果包括“旁边的”时,下次语音控制事件对应的分类的结果为“附近的”。
在本发明实施例中,失败原因为搜索到的与所述历史语音控制事件的关键词对应的结果为错误结果时,可以判定当前预设的搜索算法需要完善。接收用户输入的对预设算法的修正数据,并根据搜索算法的修正数据对所述预设搜索算法进行修正。
例如,当检测到用户搜索路口类的语音数据处理的成功率较低,则可以接收用户对路口的搜索算法的修正数据,并对路口的搜索算法进行修正。接收到的语音数据为“河南中路与南京东路交叉口”,采用两条路名“河南中路”与“南京东路”进行搜索时,搜索到的结果为错误结果。在对搜索算法进行修正时,可以通过在“河南中路”与“南京东路”之间添加空格的方式,修正搜索算法,从而提高搜索成功率。
参照图2,本发明实施例中提供了一种移动终端语音数据处理装置,包括:采集单元21、识别单元22、处理单元23、查找单元24、获取单元25、发送单元26,其中:
采集单元21,适于采集用户输入的语音数据;
识别单元22,适于对所述采集单元21采集的所述语音数据进行识别;
处理单元23,适于根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;
查找单元24,适于从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的被控电子设备的执行结果为执行成功;
获取单元25,适于从所述第一历史语音控制事件中获取对应的历史控制指令;
发送单元26,适于将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (11)

1.一种移动终端语音数据处理方法,其特征在于,包括:
采集用户输入的语音数据;
对所述语音数据进行识别;
根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;
从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的被控电子设备的执行结果为执行成功;
从所述第一历史语音控制事件中获取对应的历史控制指令,并将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。
2.根据权利要求1所述的移动终端语音数据处理方法,其特征在于,还包括:
当从历史语音控制事件中,查找到与所述关键词及所述分类的结果相匹配的历史语音控制事件的数目超过一个时,获取当前采集用户输入语音数据的时间信息;
将距离当前时间最近的历史语音控制事件作为所述第一历史语音控制事件。
3.根据权利要求1所述的移动终端语音数据处理方法,其特征在于,还包括:
当未查找到所述第一历史语音控制事件时,根据所述关键词及所述分类的结果生成当前控制指令,并将所述当前控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述当前控制指令对应的操作。
4.根据权利要求1所述的移动终端语音数据处理方法,其特征在于,还包括:
对所述历史语音控制事件进行统计分析,获取各历史语音控制事件对应的被控电子设备的执行结果;
根据所述各历史语音控制事件对应的被控电子设备的执行结果,统计所述历史语音控制事件的执行成功率;
将统计结果输出,以告知用户。
5.根据权利要求4所述的移动终端语音数据处理方法,其特征在于,还包括:
当所述历史语音控制事件对应的被控电子设备的执行结果为执行失败时,分析失败原因并输出,以告知用户;
接收用户输入的修正数据,对预设的数据库进行修正。
6.根据权利要求5所述的移动终端语音数据处理方法,其特征在于,当所述失败原因为未正确识别用户输入的语音数据时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:
根据所述用户输入的语音数据确定用户所属地域;
获取与所述用户所属地域对应的地方语音数据库;
根据获取到的所述地方语音数据库,对预设语音数据库进行修正。
7.根据权利要求5所述的移动终端语音数据处理方法,其特征在于,当所述失败原因为未搜索到与所述历史语音控制事件的第一关键词对应的结果时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:
获取所述第一关键词的出现次数;
判断所述第一关键词的出现次数是否超过预设第一阈值;
当超过所述第一阈值时,将所述第一关键词及与所述第一关键词相关联的信息添加到预设的搜索数据库。
8.根据权利要求5所述的移动终端语音数据处理方法,其特征在于,当所述失败原因为第一分类的结果不属于预设的分类数据库时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:
获取所述第一分类的结果的出现次数;
判断所述第一分类的结果的出现次数是否超过预设第二阈值;
当超过所述第二阈值时,根据第一分类的结果对预设的分类数据库进行更新。
9.根据权利要求8所述的移动终端语音数据处理方法,其特征在于,所述根据第一分类的结果对预设的分类数据库进行更新,包括:
将所述第一分类的结果作为一个新的分类,并对预设的分类数据库进行更新;或,
将所述第一分类的结果作为第二分类的结果的拓展词,并对预设的分类数据库进行更新。
10.根据权利要求5所述的移动终端语音数据处理方法,其特征在于,当所述失败原因为搜索到的与所述历史语音控制事件的关键词对应的结果为错误结果时,所述接收用户输入的修正数据,对预设的数据库进行修正,包括:
接收用户输入的对预设搜索算法的修正数据,并根据所述搜索算法的修正数据对所述预设搜索算法进行修正。
11.一种移动终端语音数据处理装置,其特征在于,包括:
采集单元,适于采集用户输入的语音数据;
识别单元,适于对所述采集单元采集的所述语音数据进行识别;
处理单元,适于根据识别结果,获取所述语音数据对应的关键词以及被控电子设备的标识信息,并按照所述语音数据中的用户的目的进行分类;
查找单元,适于从历史语音控制事件中,查找与所述关键词及所述分类的结果相匹配的第一历史语音控制事件,所述第一历史语音控制事件对应的被控电子设备的执行结果为执行成功;
获取单元,适于从所述第一历史语音控制事件中获取对应的历史控制指令;
发送单元,适于将所述历史控制指令发送至与所述标识信息对应的被控电子设备,以控制所述被控电子设备执行与所述历史控制指令对应的操作。
CN201610600179.3A 2016-07-27 2016-07-27 移动终端语音数据处理方法及装置 Active CN107665710B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610600179.3A CN107665710B (zh) 2016-07-27 2016-07-27 移动终端语音数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610600179.3A CN107665710B (zh) 2016-07-27 2016-07-27 移动终端语音数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN107665710A true CN107665710A (zh) 2018-02-06
CN107665710B CN107665710B (zh) 2021-02-09

Family

ID=61115089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610600179.3A Active CN107665710B (zh) 2016-07-27 2016-07-27 移动终端语音数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN107665710B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597499A (zh) * 2018-04-02 2018-09-28 联想(北京)有限公司 语音处理方法以及语音处理装置
CN108877774A (zh) * 2018-07-12 2018-11-23 四川虹美智能科技有限公司 一种数据采集装置、数据分析平台、系统及方法
CN109616120A (zh) * 2019-02-20 2019-04-12 上海昊沧系统控制技术有限责任公司 一种基于语音的应用内交互方法及系统
CN109815310A (zh) * 2018-12-26 2019-05-28 珠海格力电器股份有限公司 一种语音处理方法、装置、存储介质及终端
CN110364155A (zh) * 2019-07-30 2019-10-22 广东美的制冷设备有限公司 语音控制报错方法、电器及计算机可读存储介质
CN110473530A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 指令分类方法、装置、电子设备及计算机可读存储介质
CN110827647A (zh) * 2019-11-06 2020-02-21 上海国景模型设计有限公司 一种沙盘控制方法及装置
CN111114464A (zh) * 2018-10-31 2020-05-08 上海博泰悦臻网络技术服务有限公司 车载说明书播报方法、装置、存储介质、车机
CN111816192A (zh) * 2020-07-07 2020-10-23 云知声智能科技股份有限公司 语音设备及其控制方法、装置和设备
CN112017663A (zh) * 2020-08-14 2020-12-01 博泰车联网(南京)有限公司 一种语音泛化方法、装置及计算机存储介质
CN112289313A (zh) * 2019-07-01 2021-01-29 华为技术有限公司 一种语音控制方法、电子设备及系统
CN112420042A (zh) * 2020-11-19 2021-02-26 国网北京市电力公司 电力系统的控制方法及装置
CN112581957A (zh) * 2020-12-04 2021-03-30 浪潮电子信息产业股份有限公司 一种计算机语音控制方法、系统及相关装置
CN112929502A (zh) * 2021-02-05 2021-06-08 国家电网有限公司客户服务中心 一种基于电力客服的语音识别方法及系统
JP2021089576A (ja) * 2019-12-04 2021-06-10 株式会社東芝 情報処理装置、情報処理方法およびプログラム
CN114187910A (zh) * 2021-12-16 2022-03-15 平安证券股份有限公司 基于语音识别的信息输入方法、装置、设备及存储介质
CN116048765A (zh) * 2023-03-17 2023-05-02 荣耀终端有限公司 任务处理方法、样本数据处理方法及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003296157A1 (en) * 2003-01-15 2004-08-10 Matsushita Electric Industrial Co., Ltd. Broadcast reception method, broadcast reception system, recording medium, and program
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
KR20110054218A (ko) * 2009-11-17 2011-05-25 현대모비스 주식회사 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN103037117A (zh) * 2011-09-29 2013-04-10 中国电信股份有限公司 语音识别方法、系统和语音接入平台
CN103186607A (zh) * 2011-12-30 2013-07-03 大连天维科技有限公司 分布式语音检索系统
CN103903611A (zh) * 2012-12-24 2014-07-02 联想(北京)有限公司 一种语音信息的识别方法和设备
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003296157A1 (en) * 2003-01-15 2004-08-10 Matsushita Electric Industrial Co., Ltd. Broadcast reception method, broadcast reception system, recording medium, and program
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
KR20110054218A (ko) * 2009-11-17 2011-05-25 현대모비스 주식회사 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
CN103037117A (zh) * 2011-09-29 2013-04-10 中国电信股份有限公司 语音识别方法、系统和语音接入平台
CN103186607A (zh) * 2011-12-30 2013-07-03 大连天维科技有限公司 分布式语音检索系统
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN103903611A (zh) * 2012-12-24 2014-07-02 联想(北京)有限公司 一种语音信息的识别方法和设备
CN104933081A (zh) * 2014-03-21 2015-09-23 阿里巴巴集团控股有限公司 一种搜索建议提供方法及装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597499A (zh) * 2018-04-02 2018-09-28 联想(北京)有限公司 语音处理方法以及语音处理装置
CN108877774A (zh) * 2018-07-12 2018-11-23 四川虹美智能科技有限公司 一种数据采集装置、数据分析平台、系统及方法
CN111114464A (zh) * 2018-10-31 2020-05-08 上海博泰悦臻网络技术服务有限公司 车载说明书播报方法、装置、存储介质、车机
CN109815310A (zh) * 2018-12-26 2019-05-28 珠海格力电器股份有限公司 一种语音处理方法、装置、存储介质及终端
CN109815310B (zh) * 2018-12-26 2020-11-17 珠海格力电器股份有限公司 一种语音处理方法、装置、存储介质及终端
CN109616120A (zh) * 2019-02-20 2019-04-12 上海昊沧系统控制技术有限责任公司 一种基于语音的应用内交互方法及系统
CN112289313A (zh) * 2019-07-01 2021-01-29 华为技术有限公司 一种语音控制方法、电子设备及系统
CN110364155A (zh) * 2019-07-30 2019-10-22 广东美的制冷设备有限公司 语音控制报错方法、电器及计算机可读存储介质
CN110473530A (zh) * 2019-08-21 2019-11-19 北京百度网讯科技有限公司 指令分类方法、装置、电子设备及计算机可读存储介质
CN110473530B (zh) * 2019-08-21 2021-12-07 北京百度网讯科技有限公司 指令分类方法、装置、电子设备及计算机可读存储介质
CN110827647A (zh) * 2019-11-06 2020-02-21 上海国景模型设计有限公司 一种沙盘控制方法及装置
JP2021089576A (ja) * 2019-12-04 2021-06-10 株式会社東芝 情報処理装置、情報処理方法およびプログラム
JP7225082B2 (ja) 2019-12-04 2023-02-20 株式会社東芝 情報処理装置、情報処理方法およびプログラム
CN111816192A (zh) * 2020-07-07 2020-10-23 云知声智能科技股份有限公司 语音设备及其控制方法、装置和设备
CN112017663A (zh) * 2020-08-14 2020-12-01 博泰车联网(南京)有限公司 一种语音泛化方法、装置及计算机存储介质
CN112017663B (zh) * 2020-08-14 2024-04-30 博泰车联网(南京)有限公司 一种语音泛化方法、装置及计算机存储介质
CN112420042A (zh) * 2020-11-19 2021-02-26 国网北京市电力公司 电力系统的控制方法及装置
CN112581957A (zh) * 2020-12-04 2021-03-30 浪潮电子信息产业股份有限公司 一种计算机语音控制方法、系统及相关装置
CN112929502A (zh) * 2021-02-05 2021-06-08 国家电网有限公司客户服务中心 一种基于电力客服的语音识别方法及系统
CN114187910A (zh) * 2021-12-16 2022-03-15 平安证券股份有限公司 基于语音识别的信息输入方法、装置、设备及存储介质
CN116048765A (zh) * 2023-03-17 2023-05-02 荣耀终端有限公司 任务处理方法、样本数据处理方法及电子设备
CN116048765B (zh) * 2023-03-17 2023-09-01 荣耀终端有限公司 任务处理方法、样本数据处理方法及电子设备

Also Published As

Publication number Publication date
CN107665710B (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN107665710A (zh) 移动终端语音数据处理方法及装置
CN107240398B (zh) 智能语音交互方法及装置
US20200349175A1 (en) Address Search Method and Device
CN105976818B (zh) 指令识别的处理方法及装置
CN108287858A (zh) 自然语言的语义提取方法及装置
CN110648553B (zh) 一种站点提醒方法、电子设备及计算机可读存储介质
CN106601257B (zh) 一种声音识别方法、设备和第一电子设备
US9799333B2 (en) System and method for processing speech to identify keywords or other information
CN110110038B (zh) 话务预测方法、装置、服务器及存储介质
CN105025051A (zh) 一种云端语音服务提供方法和系统
CN102074231A (zh) 语音识别方法和语音识别系统
CN110209809B (zh) 文本聚类方法和装置、存储介质及电子装置
CN109933774A (zh) 语义识别方法、装置存储介质和电子装置
CN111428512A (zh) 一种语义识别方法、装置及设备
CN106205613B (zh) 一种导航语音识别方法及系统
CN113837669B (zh) 一种标签体系的评价指标构建方法和相关装置
CN103092928A (zh) 语音查询方法及系统
CN104462105A (zh) 中文分词方法、装置和服务器
CN110085217A (zh) 语音导航方法、装置及终端设备
US10593323B2 (en) Keyword generation apparatus and keyword generation method
CN111949699A (zh) 一种基于多重验证的轨迹碰撞方法及系统
CN106776543A (zh) 新词发现方法、装置、终端及服务器
WO2016056482A1 (ja) 検索システム
CN113076397A (zh) 意图识别方法、装置、电子设备及存储介质
CN106228975A (zh) 一种移动终端的语音识别系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant