CN113160807A - 一种语料库更新方法及其系统、语音控制设备 - Google Patents

一种语料库更新方法及其系统、语音控制设备 Download PDF

Info

Publication number
CN113160807A
CN113160807A CN202010073090.2A CN202010073090A CN113160807A CN 113160807 A CN113160807 A CN 113160807A CN 202010073090 A CN202010073090 A CN 202010073090A CN 113160807 A CN113160807 A CN 113160807A
Authority
CN
China
Prior art keywords
corpus
voice
information
default
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010073090.2A
Other languages
English (en)
Inventor
韩子天
冉光伟
李立标
蔡吉晨
刘子鸽
张宗煜
邓贵中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Angtong Technology Macau Co ltd
Guangzhou Automobile Group Co Ltd
Original Assignee
Angtong Technology Macau Co ltd
Guangzhou Automobile Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Angtong Technology Macau Co ltd, Guangzhou Automobile Group Co Ltd filed Critical Angtong Technology Macau Co ltd
Priority to CN202010073090.2A priority Critical patent/CN113160807A/zh
Publication of CN113160807A publication Critical patent/CN113160807A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及一种语料库更新方法及其系统、语音控制设备,所述方法包括:获取用户输入的语音指令,并根据所述语音指令获得语音文本;对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的提示信息;获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。实施本发明,能够实现基于用户的个性化语料库语料持续新增。

Description

一种语料库更新方法及其系统、语音控制设备
技术领域
本发明涉及词义信息处理技术领域,具体涉及一种语料库更新方法及其系统、语音控制设备。
背景技术
语料库是为一个或者多个应用目标而专门收集的,有一定结构的、有代表的、可被计算机程序检索的、具有一定规模的语料集合。语料的获取途径通常来自于开放性语料数据集、爬虫技术、自有平台,也因此,语料的新增扩展基本都是在后台进行,且一般是非连续性的。一般的语音控制设备,对于其最终用户而言,只有使用的权利,而不具备个性化语料动态扩展功能。
在实现本发明的过程中,发明人发现现有技术至少存在如下技术问题:现有语音识别系统进行增加语料库或者语料库升级的方法通常是基于大数据,后台进行训练和升级,非常规及个性化的用语一般都会被清洗掉,且不支持用户的本地化增加。
发明内容
本发明旨在提出一种语料库更新方法及其系统、语音控制设备,以实现基于用户的个性化数据的语料库语料持续新增。
第一方面,本发明实施例提出一种语料库更新方法,包括:
步骤S1、获取用户输入的语音指令,并根据所述语音指令获得语音文本;
步骤S2、对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;
步骤S3、获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
优选地,对所述语音文本进行识别包括:
检索语料库中是否存在与所述语音文本对应的语料,若语料库中存在与所述语音文本对应的语料,则识别成功,若语料库中不存在与所述语音文本对应的语料,则无法识别。
优选地,所述步骤S2包括:
若成功识别所述语音文本,则根据检索到的语料库中与所述语音文本对应的语料,生成任务指令和播报指令,所述任务指令用于控制执行单元执行相应任务,所述播报指令用于控制播报单元进行与语料对应内容的播报。
优选地,所述步骤S3包括:
在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;
获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
优选地,获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中,具体包括:
获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;
在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
优选地,所述方法还包括:
根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
优选地,所述方法还包括:
获取用户输入的语料修改信息或语料删除信息;
根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
第二方面,本发明实施例提出一种语料库更新系统,包括:
信息获取单元,用于获取用户输入的语音指令,并根据所述语音指令获得语音文本;
识别处理单元,用于对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;以及
语料更新单元,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
优选地,所述语料更新单元包括:
第一更新处理单元,用于在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
第二更新处理单元,用于当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;以及
第三更新处理单元,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
优选地,所述第三更新处理单元包括:
默认语料获取单元,用于获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
语料确认提示单元,用于根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;以及
语料新增单元,用于在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
优选地,所述系统还包括:
确定单元,用于根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
优选地,所述系统还包括:
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
第三方面,本发明实施例提出一种语音控制设备,包括:根据本发明实施例所述的语料库更新系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据本发明实施例所述语料库更新方法的步骤。
相对于现有技术,以上技术方案具有如下有益效果:进行语料库更新时,需获取待新增至语料库中的语料,即用户输入的语音文本,对所述语音文本进行语义信息处理,识别所述语音文本,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;用户在得到第一提示信息的提示后,手动操作执行单元执行相应的任务,执行单元执行任务过程中生成任务操作信息,即表示执行了哪些任务;进一步地,获取与所述任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。通过采用用户手动操作进行示教的方式,对新增的语料进行自定义,实现基于用户的个性化数据的语料库语料持续新增。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一中一种语料库更新方法流程示意图。
图2为本发明实施例二中一种语料库更新系统框架示意图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
另外,为了更好的说明本发明,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的手段未作详细描述,以便于凸显本发明的主旨。
本发明一实施例提出一种语料库更新方法,可以应用于车载语音助手,图1为本实施例所述语料库更新方法的流程图,参阅图1,本实施例所述方法包括如下步骤S101至S103:
步骤S101、获取用户输入的语音指令,并根据所述语音指令获得语音文本;
示例性地,用户可以通过麦克风输入语音指令,步骤中可以利用自动语音识别(Automatic Speech Recognition,ASR)系统对用户输入的语音指令进行处理转换为语音文本,通过相应的接口可以获取已转化成功的所述语音文本。
步骤S102、对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;
具体而言,步骤中通过NPL引擎(Natural Language Processing)对所述语音文本进行语义信息处理。当NPL引擎无法识别所述语音文本时,表明语料库中不存在与所述语音文本对应的语料,即所述语音指令为未定义的指令。此时,进入语料的增量学习过程,输出请求用户进行动作示教的第一提示信息,所述第一提示信息例如为“这个问题我还不懂,请你教我”。示例性地,所述第一提示信息的提示方式可以是语音方式和/或显示单元进行显示的方式。
步骤S103、获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
具体而言,用户在得到第一提示信息的提示之后,在预设时间内对相应的执行单元进行手动操作,即完成示教,手动操作过程中,根据相应的执行单元的任务操作情况可以得到所述任务操作信息。根据所述任务操作信息,可以确定与所述任务操作信息对应的若干默认语料;所述默认语料指的是存储于语料库中的语料,其为非用户自定义的语料,即从后台数据库下载更新的语料;进一步地,将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
因此,本实施例方法通过采用用户手动操作进行示教的方式,对新增的语料进行自定义,能够实现基于用户的个性化数据的语料库语料持续新增。
示例性地,本实施例中语料库包括默认语料库和动态语料库,所述默认语料库用于存储多个默认语料,所述动态语料库用于存储用户自定义的语料,如用户进行示教定义的新增语料,此外,语料库中还存储有表征语料之间关系的表格或其他形式。
在一具体实施例中,对所述语音文本进行识别包括:
NPL引擎检索语料库中是否存在与所述语音文本对应的语料,若语料库中存在与所述语音文本对应的语料,则识别成功,若语料库中不存在与所述语音文本对应的语料,则无法识别。
例如,在车载场景下用户发出“打开冷气”这条语音指令,语料库中只存储了“打开空调”的语料,因此无法识别“打开冷气”。
又例如,在车载场景下用户发出“打开空调”这条语音指令,语料库中存储了“打开空调”的语料,因此能识别“打开空调”。
在一具体实施例中,所述步骤S102还包括:
若成功识别所述语音文本,则根据检索到的语料库中与所述语音文本对应的语料,生成任务指令和播报指令,所述任务指令用于控制执行单元执行相应任务,所述播报指令用于控制播报单元进行与语料对应内容的播报。
具体而言,例如,在车载场景下用户发出“打开空调”这条语音指令,语料库中存储了“打开空调”的语料,因此能识别“打开空调”,则生成“打开空调”的任务指令和播报指令,空调接收到该任务指令后启动运行,播报单元接收到该播报指令后播报“打开空调”或“空调正在打开”等,具体播报内容可以预先设置,并不一定要与语音指令相同。
需说明的是,识别语音文本时可以得到语音文本的意图,语音文本的意图与语料是对应的,本文中所指根据语料生成任务指令具体可以理解为是生成与意图对应的任务指令。
在一具体实施例中,所述步骤S103包括:
步骤S201、在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
步骤S202、当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;
步骤S203、获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
下面列举两种情况对本实施例步骤S103进行具体说明:
在一示例中,例如通过语音方式播报“这个问题我还不懂,请你教我”,用户在听到播报之后,在预设时间内对相应的执行单元进行操作,以“打开冷气”为例,用户在预设时间内打开空调,操作结束后,输入示教结束语音指令,示教结束语音指令例如是“示教结束”,又例如“示教完毕”,又例如“我已教完”,具体可以根据用户用语习惯进行设置。当接收到用户输入的示教结束语音指令时,表明用户已经示教完毕,假设输出第一提示信息的时刻为T1,接收到用户输入的示教结束语音指令的时刻为T2,则步骤中获取T1至T2这一时间段内用户对执行单元的任务操作信息,T1至T2时间段内空调在用户在手动操作下打开,即任务操作信息对应为打开空调;则默认语料为“打开空调”,则将默认语料“打开空调”与语音文本“打开冷气”建立语料关系,即“打开冷气”等于“打开空调”,最后将“打开冷气”作为新的语料、以及语料“打开冷气”与语料“打开空调”的关系存储至语料库中。
具体地,经过用户对“打开冷气”这一语音指令的自定义之后,当用户再次发出“打开冷气”的语音指令后,由于“打开冷气”的语料及其与其他语料“打开空调”的关系已经在存储于语料库中,因此,NPL引擎能够对“打开冷气”的语音文本进行识别,在语料库中检索到语料“打开冷气”、语料“打开空调”、以及“打开冷气”等于“打开空调”的语料关系,则根据语料“打开空调”生成打开空调的任务指令和相应的播报指令。
本示例中用户采用单一行为动作的方式进行语料的意图示教,采用了一种精确、直接、快速、简单的方式进行语音指令的领域、意图识别,新增语料和行为动作对应的原默认语料的绑定和对应,完成语料新增后,后续的操作中,系统输入不完全一致的语音文本,根据语料的语料关系,对于非默认语料(用户自定义的动态语料)也能有效识别。
在另一示例中,例如通过语音方式播报“这个问题我还不懂,请你教我”,用户在听到播报之后,在预设时间内对相应的执行单元进行操作,以“天气好热”为例,用户在预设时间内打开空调并关闭车窗,操作结束后,输入示教结束语音指令,示教结束语音指令例如是“示教结束”,又例如“示教完毕”,具体可以根据用户用语习惯进行设置。当接收到用户输入的示教结束语音指令时,表明用户已经示教完毕,假设输出第一提示信息的时刻为T1,接收到用户输入的示教结束语音指令的时刻为T2,则步骤中获取T1至T2这一时间段内用户对执行单元的任务操作信息,T1至T2时间段内空调在用户在手动操作下打开,车窗在用户在手动操作下关闭,即任务操作信息对应为打开空调和关闭车窗;则默认语料为“打开空调”和“关闭车窗”,则将默认语料“打开空调”、“关闭车窗”分别与语音文本“天气好热”建立语料关系,即“天气好热”等于“打开空调”和“关闭车窗”,最后将“天气好热”作为新的语料、以及语料“天气好热”与语料“打开空调”和语料“关闭车窗”的关系存储至语料库中。
具体地,经过用户对“天气好热”这一语音指令的自定义之后,当用户再次发出“天气好热”的语音指令后,由于“天气好热”的语料及其与其他语料”打开空调”、“关闭车窗”的关系已经在存储于语料库中,因此,NPL引擎能够对“天气好热”的语音文本进行识别,在语料库中检索到语料“天气好热”、语料”打开空调”、“关闭车窗”、以及“天气好热”等于“打开空调”和“关闭车窗”的语料关系,则根据语料“打开空调”、“关闭车窗”生成打开空调的任务指令、关闭车窗的任务指令和相应的播报指令。
本示例中用户采用多个行为动作的方式进行语料的意图示教,采用了一种精确、直接、快速、简单的方式进行语音指令的领域、意图识别,通过本实施例方法,一条语音指令可以任意定义完成的一系列控制行为动作,通过多个用户操作行为结合的方式实现语料意图自定义,实现已有默认语料的自动组合,是一种高效、精确的语料新增方式。
在一具体实施例中,所述步骤S203具体包括:
步骤S301、获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
具体而言,例如任务操作信息为打开空调和关闭车窗两个任务,分别对应默认语料“打开空调”和“关闭车窗”。
步骤S302、根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;
具体而言,以输入语音指令为“天气好热”为例,则所述第二提示信息可以是“天气好热是不是打开空调和关闭车窗的意思”。
步骤S303、在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
具体而言,示例性地,所述第一提示信息的提示方式可以是语音方式和/或显示单元进行显示的方式。用户在得到第二提示信息的提示之后,通过语音输入单元或物理输入单元输入确认信息,例如发出语音指令“是”。在接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
在一具体实施例中,所述方法还包括:
步骤S401、根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
步骤S402、根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
具体而言,本实施例中提供语料及其对应的任务的显示,以便于用户进行查看。在应用过程中,可以由用户通过语音方式或通过物理输入单元输入一查看请求信息,在获取到查看请求信息后,执行所述步骤S401-步骤S402,具体可以通过车载终端的显示单元进行显示。
在一具体实施例中,所述方法还包括:
步骤S501、获取用户输入的语料修改信息或语料删除信息;
步骤S502、根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
具体而言,所述语料修改信息可以是对语料的用词或语料之间的语料关系进行修改,所述语料删除信息可以是对语料的用词或语料之间的语料关系进行删除,以便于用户对语料库中的指令进行删改。在应用过程中,车载终端的显示单元显示语料及其对应的任务,可以由用户通过语音方式或通过物理输入单元输入语料修改信息或语料删除信息,在获取到语料修改信息或语料删除信息后,执行所述步骤S501-步骤S502。
本发明另一实施例提出一种语料库更新系统,可以用于实现上述实施例中所述的语料库更新方法,图2为本实施例所述系统的框架图,参阅图2,本实施例所述系统包括:
信息获取单元1,用于获取用户输入的语音指令,并根据所述语音指令获得语音文本;
识别处理单元2,用于对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;以及
语料更新单元3,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
在一具体实施例中,所述识别处理单元2具体包括:
文本识别单元21,用于对所述语音文本进行识别;具体地,检索语料库中是否存在与所述语音文本对应的语料,若语料库中存在与所述语音文本对应的语料,则识别成功,若语料库中不存在与所述语音文本对应的语料,则无法识别;
示教提示单元22,用于若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;以及
任务指令生成单元23,用于若成功识别所述语音文本,则根据检索到的语料库中与所述语音文本对应的语料,生成任务指令和播报指令,所述任务指令用于控制执行单元执行相应任务,所述播报指令用于控制播报单元进行与语料对应内容的播报。
在一具体实施例中,所述语料更新单元3包括:
第一更新处理单元31,用于在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
第二更新处理单元32,用于当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;以及
第三更新处理单元33,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
在一具体实施例中,所述第三更新处理单元33包括:
默认语料获取单元,用于获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
语料确认提示单元,用于根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;以及
语料新增单元,用于在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
在一具体实施例中,所述系统还包括:
确定单元,用于根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
在一具体实施例中,所述系统还包括:
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
需说明的是,上述实施例所述系统与上述实施例所述方法对应,因此,上述实施例所述系统未详述部分可以参阅上述实施例所述方法的内容得到,此处不再赘述。
并且,上述实施例所述语料库更新系统如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
本发明实施例还提出一种语音控制设备,包括上述实施例中的语料库更新系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据上述语料库更新方法的步骤。
当然,所述语音控制设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该语音控制设备还可以包括其他用于实现设备功能的部件,在此不做赘述。
示例性的,所述计算机程序可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述语音控制设备中的执行过程。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述语音控制设备的控制中心,利用各种接口和线路连接整个所述语音控制设备的各个部分。
所述存储器可用于存储所述计算机程序和/或单元,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或单元,以及调用存储在存储器内的数据,实现所述语音控制设备的各种功能。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (11)

1.一种语料库更新方法,其特征在于,包括:
步骤S1、获取用户输入的语音指令,并根据所述语音指令获得语音文本;
步骤S2、对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;
步骤S3、获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
2.根据权利要求1所述的语料库更新方法,其特征在于,对所述步骤S2包括:
检索语料库中是否存在与所述语音文本对应的语料,若语料库中存在与所述语音文本对应的语料,则识别成功,若语料库中不存在与所述语音文本对应的语料,则无法识别;
若成功识别所述语音文本,则根据检索到的语料库中与所述语音文本对应的语料,生成任务指令和播报指令,所述任务指令用于控制执行单元执行相应任务,所述播报指令用于控制播报单元进行与语料对应内容的播报。
3.根据权利要求1所述的语料库更新方法,其特征在于,所述步骤S3包括:
在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;
获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
4.根据权利要求3所述的语料库更新方法,其特征在于,获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中,具体包括:
获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;
在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
5.根据权利要求1所述的语音控制方法,其特征在于,所述方法还包括:
根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
6.根据权利要求5所述的语音控制方法,其特征在于,所述方法还包括:
获取用户输入的语料修改信息或语料删除信息;
根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
7.一种语料库更新系统,其特征在于,包括:
信息获取单元,用于获取用户输入的语音指令,并根据所述语音指令获得语音文本;
识别处理单元,用于对所述语音文本进行识别,若无法识别所述语音文本,则输出请求用户进行动作示教的第一提示信息;以及
语料更新单元,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中;其中,所述任务操作信息为输出第一提示信息后,在预设时间内用户操作执行单元执行相应任务的信息。
8.根据权利要求7所述的语料库更新系统,其特征在于,所述语料更新单元包括:
第一更新处理单元,用于在输出第一提示信息后,接收用户在预设时间内输入的示教结束语音指令;
第二更新处理单元,用于当接收到用户输入的示教结束语音指令时,获取输出第一提示信息后至用户输入示教结束语音指令的时间段内的任务操作信息;以及
第三更新处理单元,用于获取与任务操作信息对应的若干默认语料,并将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
9.根据权利要求8所述的语料库更新系统,其特征在于,所述第三更新处理单元包括:
默认语料获取单元,用于获取与任务操作信息对应的若干默认语料;其中,所述任务操作信息包括若干任务的操作信息,每一任务对应一个默认语料;
语料确认提示单元,用于根据所述若干默认语料输出第二提示信息,所述第二提示信息用于请求用户确认所述若干默认语料与所述语音文本是否一致;以及
语料新增单元,用于在输出第二提示信息后,若接收到用户输入的确认信息,则将所述若干默认语料与所述语音文本建立语料关系后,将所述语音文本作为新的语料与所述语料关系一并存储至语料库中。
10.根据权利要求7所述的语音控制系统,其特征在于,所述系统还包括:
确定单元,用于根据语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息;
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除语料库中的语料和/或语料关系。
11.一种语音控制设备,包括:根据权利要求7-10中任一项所述的语料库更新系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据权利要求1-6中任一项所述语料库更新方法的步骤。
CN202010073090.2A 2020-01-22 2020-01-22 一种语料库更新方法及其系统、语音控制设备 Pending CN113160807A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010073090.2A CN113160807A (zh) 2020-01-22 2020-01-22 一种语料库更新方法及其系统、语音控制设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010073090.2A CN113160807A (zh) 2020-01-22 2020-01-22 一种语料库更新方法及其系统、语音控制设备

Publications (1)

Publication Number Publication Date
CN113160807A true CN113160807A (zh) 2021-07-23

Family

ID=76881696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010073090.2A Pending CN113160807A (zh) 2020-01-22 2020-01-22 一种语料库更新方法及其系统、语音控制设备

Country Status (1)

Country Link
CN (1) CN113160807A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113909743A (zh) * 2021-09-30 2022-01-11 北京博清科技有限公司 焊接的控制方法、控制装置和焊接系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1935065A (zh) * 2005-09-19 2007-03-28 刘小勇 烹饪提示方法及其装置
CN101013635A (zh) * 2006-12-13 2007-08-08 淄博微联电子有限公司 防止电气误操作的智能远控闭锁方法及其装置
CN105679315A (zh) * 2016-03-22 2016-06-15 谢奇 一种语音控制且可语音编程的控制方法和系统
CN106156022A (zh) * 2015-03-23 2016-11-23 联想(北京)有限公司 一种信息处理方法及电子设备
CN107195300A (zh) * 2017-05-15 2017-09-22 珠海格力电器股份有限公司 语音控制方法和系统
CN108831469A (zh) * 2018-08-06 2018-11-16 珠海格力电器股份有限公司 语音命令定制方法、装置和设备及计算机存储介质
CN110570867A (zh) * 2019-09-12 2019-12-13 安信通科技(澳门)有限公司 一种本地新增语料的语音处理方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1935065A (zh) * 2005-09-19 2007-03-28 刘小勇 烹饪提示方法及其装置
CN101013635A (zh) * 2006-12-13 2007-08-08 淄博微联电子有限公司 防止电气误操作的智能远控闭锁方法及其装置
CN106156022A (zh) * 2015-03-23 2016-11-23 联想(北京)有限公司 一种信息处理方法及电子设备
CN105679315A (zh) * 2016-03-22 2016-06-15 谢奇 一种语音控制且可语音编程的控制方法和系统
CN107195300A (zh) * 2017-05-15 2017-09-22 珠海格力电器股份有限公司 语音控制方法和系统
CN108831469A (zh) * 2018-08-06 2018-11-16 珠海格力电器股份有限公司 语音命令定制方法、装置和设备及计算机存储介质
CN110570867A (zh) * 2019-09-12 2019-12-13 安信通科技(澳门)有限公司 一种本地新增语料的语音处理方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113909743A (zh) * 2021-09-30 2022-01-11 北京博清科技有限公司 焊接的控制方法、控制装置和焊接系统

Similar Documents

Publication Publication Date Title
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
CN106098063B (zh) 一种语音控制方法、终端设备和服务器
CN109979450B (zh) 信息处理方法、装置及电子设备
CN112017646A (zh) 一种语音处理方法、装置及计算机存储介质
CN112149419B (zh) 字段的规范化自动命名方法、装置及系统
CN110691160A (zh) 一种语音控制方法、装置及手机
KR20220052581A (ko) 검색 질의의 의도를 반영한 검색 결과 제공 방법 및 시스템
CN109064787B (zh) 一种点读设备
CN109326284A (zh) 语音搜索的方法、装置和存储介质
CN112346697A (zh) 一种对设备进行控制的方法、装置和存储介质
CN112004145A (zh) 节目广告跳过处理方法、装置、电视及系统
CN113160807A (zh) 一种语料库更新方法及其系统、语音控制设备
CN110797012A (zh) 一种信息提取方法、设备及存储介质
CN111063337B (zh) 可快速更新语言模型的大规模语音识别方法及系统
CN112151034A (zh) 设备的语音控制方法、装置、电子设备及存储介质
US11726656B2 (en) Intelligent keyboard
CN112114770A (zh) 基于语音交互的界面引导方法、装置及设备
CN112533007B (zh) 网络直播方法、系统、终端设备及存储介质
US7822614B2 (en) Device control, speech recognition device, agent device, control method
CN112380871A (zh) 语义识别方法、设备及介质
CN110895924B (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质
CN113241067B (zh) 一种语音交互方法及其系统、语音交互设备
CN113160808A (zh) 一种语音控制方法及其系统、语音控制设备
CN113470636B (zh) 一种语音信息处理方法、装置、设备及介质
CN111753046A (zh) 控制智能设备的方法及装置、电子设备、以及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination