CN109065040A - 一种语音信息处理方法以及智能电器 - Google Patents

一种语音信息处理方法以及智能电器 Download PDF

Info

Publication number
CN109065040A
CN109065040A CN201810879325.XA CN201810879325A CN109065040A CN 109065040 A CN109065040 A CN 109065040A CN 201810879325 A CN201810879325 A CN 201810879325A CN 109065040 A CN109065040 A CN 109065040A
Authority
CN
China
Prior art keywords
text
instruction
speech text
speech
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810879325.XA
Other languages
English (en)
Inventor
赵鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Racing Current Network Information Technology Co Ltd
Original Assignee
Beijing Racing Current Network Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Racing Current Network Information Technology Co Ltd filed Critical Beijing Racing Current Network Information Technology Co Ltd
Priority to CN201810879325.XA priority Critical patent/CN109065040A/zh
Publication of CN109065040A publication Critical patent/CN109065040A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请涉及一种语音信息处理方法以及智能电器,以高效和快速地执行用户的语音信息所对应的交互指令,该种语音信息处理方法包括:接收用户的语音信息,并且将所述语音信息识别为语音文本;判断所述语音文本是否已经预先存储在本地设备中;如果是,则执行所述语音文本对应的指令;如果不是,则将所述语音文本上传至云端服务器,以执行自然语言处理。本申请利用唤醒词将ASR服务调起后,循环接收用户输入的指令,将上述存储过的指令文本作为过滤器,过滤出命中指令后,执行相应命令并反馈结果给用户。这样预先存储在本地设备中的一些指令便可以快速命中和执行,大大提高了用户体验。

Description

一种语音信息处理方法以及智能电器
技术领域
本申请涉及智能控制领域,特别的,涉及一种语音信息处理方法。此外,本申请还涉及一种实现了该种语音信息处理方法的智能电器。
背景技术
目前,随着远场语音识别技术的进步,人工智能(artificial intelligence,简称AI)的快速发展,以及自动语言识别技术(automatic speech recognition,简称ASR)、自然语言处理(Natural Language Processing,简称NLP)等的应用,家用智能设备(例如智能电视)对语音、语义的识别和理解有了较大的提升,因此一种新的交互方式出现在智能电视、IP机顶盒上。用户可以坐在电视机前,直接通过语音完成调节音量、搜索影片、开机关机等指令,从而在一些场景下摆脱了传统摇控器的束缚,非常方便。
如图1所示,在用户与具有远场语音交互功能的电器设备进行交互之前,都需要确保ASR服务的开启,然后先说出唤醒词(比如,暴风电视的“暴风大耳朵”),接着再说出命令语句以下达指令,然后远程(云端)NLP服务接收识别出的语音文本并且开始对该文本进行处理,从而明确用户意图并且将反馈结果反馈给智能电器,智能电器响应该反馈结果。但是,这种处理方法的处理效率非常低,比如在一个多内容的列表交互界面,仅仅是一个普通的翻页动作,也需要经过从唤醒词到ASR处理,再到NLP处理返回后,才能执行用户的指令。其中的NLP服务是在云端计算完成,这非常考验用户家庭的实际网络环境,所以往往造成了用户体验非常差。
公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本申请的主要目的在于提供一种语音信息处理方法,以高效和快速地执行用户的语音信息所对应的交互指令。
为了解决上述问题,本申请涉及一种语音信息处理方法,该方法包括:接收用户的语音信息,并且将所述语音信息识别为语音文本;判断所述语音文本是否已经预先存储在本地设备中;如果是,则执行所述语音文本对应的指令;如果不是,则将所述语音文本上传至云端服务器,以执行自然语言处理。
进一步的,如果所述语音文本不是预先存储在本地的语音文本,所述方法还包括:判断所述语音文本是否对应至少一种指令;如果是,则将所述语音文本存储在本地,以作为所述预先存储在本地的语音文本。
进一步的,所述判断所述语音文本是否为预先存储在本地的语音文本包括:在本地的数据库或者缓存中查找已存储的语音文本;如果找到与所述语音文本完全匹配的已存储的语音文本,则判断所述语音文本是预先存储在本地的语音文本。
进一步的,所述方法还包括:将交互界面上的、对应有指令的指令文本的显示效果与普通文本的显示效果进行区分;并且在所述判断所述语音文本是否为预先存储在本地的语音文本之前,如果所述语音文本与所述指令文本相应,则执行所述指令文本所对应的指令。
进一步的,所述将交互界面上的、对应有指令的指令文本的显示效果与普通文本的显示效果进行区分包括:将所述指令文本进行高亮显示,从而使该指令文本的显示效果与普通文本的显示效果区分开。
进一步的,所述指令文本包括在所述普通文本中,或者所述指令文本独立于所述普通文本。
进一步的,所述交互界面上还显示有多个提示指令文本,所述提示指令文本中的每一个对应至少一种指令;其中,所述多个提示指令文本至少包括一个所述指令文本。
本申请还涉及一种智能电器,其包括用于显示交互界面的显示器或者能够将交互界面显示在其它设备的显示器上,该智能电器还包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上面所述的语音信息处理方法。
进一步的,所述智能电器可以包括:智能电视或者机顶盒。
本申请的有益效果是:通过采用本申请的技术方案,本申请利用唤醒词将ASR服务调起后,循环接收用户输入的指令,将上述存储过的指令文本作为过滤器,过滤出命中指令后,执行相应命令并反馈结果给用户。其它无命中的指令文本,直接向云端NLP服务器发送,在接到NLP服务器反馈的全局意图后,再反馈给电视处理,这样预先存储在本地设备中的一些指令便可以快速命中和执行,大大提高了用户体验。
此外,本申请还在在交互界面中展示出可用语言控制的指令文本,用户可以凭借眼睛所看到的交互界面,本能的知道如何下达指令来与智能电器进行交互,从而解决了用户在面对目前市面上支持语音识别服务的智能电器的当前交互界面而不知道如何准确的下达交互指令的问题,从而进一步提高了了用户体验和市场竞争力。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是现有的语音信息处理方法的流程图;
图2是根据本申请实施例的语音信息处理方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
此外,术语“安装”、“设置”、“设有”、“连接”、“配置为”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图2所示,图2为本申请实施例的语音信息处理方法的流程图。该方法包括以下步骤:步骤S1,接收用户的语音信息,并且将所述语音信息识别为语音文本,具体的,本申请中的ASR服务器开始响应用户的开启指令或者一直保持开启状态,以用于接收用户的语音信息并且将所述语音信息识别为语音文本。这里,本申请中的ASR服务器可以设置在用户的本地智能电器中(例如,智能电视或者机顶盒),或者设置在云端服务器中。步骤S2,判断所述语音文本是否为预先存储在本地设备中的语音文本,具体的,本申请首先判断语音文本是否预先存储在本地的硬盘(例如,数据库)或者内存(例如,缓存)中,也就是说,在本地数据库或者缓存中查找与所述语音文本完全匹配的已存储的语音文本,这里的完全匹配指的是语音文本完全等同于已存储的语音文本。
接下来,如果判断所述语音文本已经预先存储在本地,那么执行步骤S3,执行所述语音文本对应的指令,以实现该指令所对应的功能。相反的,如果不是,则执行步骤S4,则将所述语音文本存储在本地,以作为所述预先存储在本地的语音文本。此外,在预先存储之前,判断所述语音文本是否已经对应至少一种指令,如果是,那么执行存储步骤,如果所述语音文本没有对应指令,则则将所述语音文本上传至云端服务器,以执行自然语言处理(NLP),以借助NLP明确客户的意图,以执行相应的指令或者反馈相应的意图。
此外,本申请还将交互界面上的指令文本的显示效果进行特殊展示,以与同样显示在交互界面上普通文本的显示效果进行区分,优选地,可以将所述指令文本显示在交互界面的上部并且进行高亮显示,从而使该指令文本的显示效果与普通文本的显示效果区分开。这里,每一个指令文本均可以对应于至少一种指令,该指令用于实现相应的功能,例如翻页功能、选择功能或者声音调节功能等。
在所述判断所述语音文本是否为预先存储在本地的语音文本之前,如果识别出的语音文本与所述指令文本相应,则执行所述指令文本所对应的指令,以实现该指令所对应的功能。在这里,语音文本与所述指令文本相应指的是,语音文本与指令文本中的文字可以是完全匹配,也可以是部分匹配(例如,指令文本包含在语音文本中或者语音文本包含在指令文本中),也可以是模糊匹配,例如解析出的语音文本为“第一个”,而显示的指令文本为“第一页”,则可以认为语音文本与所述指令文本相应。具体的模糊匹配程度和匹配阈值可以根据需求自行设定,本发明并不做出具体限定。
特别的,本发明的指令文本可以包含在所述普通文本中,也可以独立于所述普通文本,即不包含在普通文本中而独立的显示,以更加明显地区别于普通文本。进一步的,本发明在交互界面的下部还显示有多个用于为用户提供提示性信息的提示指令文本,同样地,每一个提示指令文本也对应至少一种指令。这里的指令可以与上述的指令不同或者相同。在这些提示指令文本包括有上述指令文本的情况下,与指令文本对应的提示指令文本所对应的指令自然与该指令文本所对应的指令相同。
此外,本申请还涉及一种智能电器,其包括用于显示交互界面的显示器,例如,智能电视,或者能够将交互界面显示在其它设备的显示器上,例如机顶盒,该智能电器还包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上面所述的语音信息处理方法。
本申请所涉及的计算机软件程序可以存储于计算机可读存储介质中,所述计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体装置、虚拟装置、优盘、移动硬盘、磁碟、光盘、计算机存储器、只读计算机存储器(Read-Only Memory,ROM)、随机存取计算机存储器(Random Access Memory,RAM)、电载波信号、电信信号以及其他软件分发介质等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本申请的保护范围之内。

Claims (10)

1.一种语音信息处理方法,其特征在于,包括:
接收用户的语音信息,并且将所述语音信息识别为语音文本;
判断所述语音文本是否已经预先存储在本地设备中;
如果是,则执行所述语音文本对应的指令;
如果不是,则将所述语音文本上传至云端服务器,以执行自然语言处理。
2.根据权利要求1所述的语音信息处理方法,其特征在于,如果所述语音文本不是预先存储在本地的语音文本,所述方法还包括:
判断所述语音文本是否对应至少一种指令;
如果是,则将所述语音文本存储在本地,以作为所述预先存储在本地的语音文本。
3.根据权利要求1或2所述的语音信息处理方法,其特征在于,所述判断所述语音文本是否为预先存储在本地的语音文本包括:
在本地的数据库或者缓存中查找已存储的语音文本;
如果找到与所述语音文本完全匹配的已存储的语音文本,则判断所述语音文本是预先存储在本地的语音文本。
4.根据权利要求1或2所述的语音信息处理方法,其特征在于,该方法还包括:
将交互界面上的、对应有指令的指令文本的显示效果与普通文本的显示效果进行区分;
在所述判断所述语音文本是否为预先存储在本地的语音文本之前,如果所述语音文本与所述指令文本相应,则执行所述指令文本所对应的指令。
5.根据权利要求4所述的语音信息处理方法,其特征在于,所述将交互界面上的、对应有指令的指令文本的显示效果与普通文本的显示效果进行区分包括:将所述指令文本进行高亮显示,从而使该指令文本的显示效果与普通文本的显示效果区分开。
6.根据权利要求4所述的语音信息处理方法,其特征在于,所述指令文本包括在所述普通文本中。
7.根据权利要求4所述的语音信息处理方法,其特征在于,所述指令文本独立于所述普通文本。
8.根据权利要求4所述的语音信息处理方法,其特征在于,所述交互界面上还显示有多个提示指令文本,所述提示指令文本中的每一个对应至少一种指令;
其中,所述多个提示指令文本至少包括一个所述指令文本。
9.一种智能电器,其包括用于显示交互界面的显示器或者能够将交互界面显示在其它设备的显示器上,该智能电器还包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的语音信息处理方法。
10.根据权利要求9所述的智能电器,其特征在于,所述智能电器包括:智能电视或者机顶盒。
CN201810879325.XA 2018-08-03 2018-08-03 一种语音信息处理方法以及智能电器 Pending CN109065040A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810879325.XA CN109065040A (zh) 2018-08-03 2018-08-03 一种语音信息处理方法以及智能电器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810879325.XA CN109065040A (zh) 2018-08-03 2018-08-03 一种语音信息处理方法以及智能电器

Publications (1)

Publication Number Publication Date
CN109065040A true CN109065040A (zh) 2018-12-21

Family

ID=64831474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810879325.XA Pending CN109065040A (zh) 2018-08-03 2018-08-03 一种语音信息处理方法以及智能电器

Country Status (1)

Country Link
CN (1) CN109065040A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785840A (zh) * 2019-03-05 2019-05-21 湖北亿咖通科技有限公司 自然语言识别的方法、装置及车载多媒体主机、计算机可读存储介质
CN109920413A (zh) * 2018-12-28 2019-06-21 广州索答信息科技有限公司 一种厨房场景触屏语音对话的实现方法及存储介质
CN109979446A (zh) * 2018-12-24 2019-07-05 北京奔流网络信息技术有限公司 语音控制方法、存储介质和装置
CN110136704A (zh) * 2019-04-03 2019-08-16 北京石头世纪科技股份有限公司 机器人语音控制方法、装置、机器人和介质
CN110910886A (zh) * 2019-12-17 2020-03-24 广州三星通信技术研究有限公司 人机交互方法及装置
CN110931017A (zh) * 2019-11-26 2020-03-27 国网冀北清洁能源汽车服务(北京)有限公司 一种充电桩用充电交互方法及充电桩用充电交互装置
CN112199033A (zh) * 2020-09-30 2021-01-08 北京搜狗科技发展有限公司 一种语音输入方法、装置和电子设备
CN113035189A (zh) * 2021-02-24 2021-06-25 北京小米移动软件有限公司 一种文档演示的控制方法、装置和设备
CN113448430A (zh) * 2020-03-26 2021-09-28 中移(成都)信息通信科技有限公司 文本纠错的方法、装置、设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512182A (zh) * 2015-11-25 2016-04-20 深圳Tcl数字技术有限公司 语音控制方法及智能电视
CN106328148A (zh) * 2016-08-19 2017-01-11 上汽通用汽车有限公司 基于本地和云端混合识别的自然语音识别方法、装置和系统
CN106373377A (zh) * 2016-09-14 2017-02-01 上海百芝龙网络科技有限公司 一种双向红外家电控制系统
CN108305620A (zh) * 2018-05-09 2018-07-20 上海蓥石汽车技术有限公司 一种依赖大数据的本地云端混合的主动式交互语音识别系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512182A (zh) * 2015-11-25 2016-04-20 深圳Tcl数字技术有限公司 语音控制方法及智能电视
CN106328148A (zh) * 2016-08-19 2017-01-11 上汽通用汽车有限公司 基于本地和云端混合识别的自然语音识别方法、装置和系统
CN106373377A (zh) * 2016-09-14 2017-02-01 上海百芝龙网络科技有限公司 一种双向红外家电控制系统
CN108305620A (zh) * 2018-05-09 2018-07-20 上海蓥石汽车技术有限公司 一种依赖大数据的本地云端混合的主动式交互语音识别系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979446A (zh) * 2018-12-24 2019-07-05 北京奔流网络信息技术有限公司 语音控制方法、存储介质和装置
CN109920413A (zh) * 2018-12-28 2019-06-21 广州索答信息科技有限公司 一种厨房场景触屏语音对话的实现方法及存储介质
CN109785840A (zh) * 2019-03-05 2019-05-21 湖北亿咖通科技有限公司 自然语言识别的方法、装置及车载多媒体主机、计算机可读存储介质
CN110136704A (zh) * 2019-04-03 2019-08-16 北京石头世纪科技股份有限公司 机器人语音控制方法、装置、机器人和介质
CN110136704B (zh) * 2019-04-03 2021-12-28 北京石头世纪科技股份有限公司 机器人语音控制方法、装置、机器人和介质
CN110931017A (zh) * 2019-11-26 2020-03-27 国网冀北清洁能源汽车服务(北京)有限公司 一种充电桩用充电交互方法及充电桩用充电交互装置
CN110910886A (zh) * 2019-12-17 2020-03-24 广州三星通信技术研究有限公司 人机交互方法及装置
CN113448430A (zh) * 2020-03-26 2021-09-28 中移(成都)信息通信科技有限公司 文本纠错的方法、装置、设备和计算机可读存储介质
CN112199033A (zh) * 2020-09-30 2021-01-08 北京搜狗科技发展有限公司 一种语音输入方法、装置和电子设备
CN113035189A (zh) * 2021-02-24 2021-06-25 北京小米移动软件有限公司 一种文档演示的控制方法、装置和设备

Similar Documents

Publication Publication Date Title
CN109065040A (zh) 一种语音信息处理方法以及智能电器
CN105845137B (zh) 一种语音对话管理系统
CN104808499B (zh) 一种基于联动规则控制智能家居设备的方法及控制装置
JP6601470B2 (ja) 自然言語の生成方法、自然言語の生成装置及び電子機器
CN110262273A (zh) 一种家居设备控制方法、装置、存储介质及智能家居系统
CN105760533B (zh) 一种照片管理方法和装置
CN105551488A (zh) 语音控制方法及系统
CN116483980A (zh) 人机交互方法、装置及系统
CN112612214B (zh) 用于功能界面生成的方法、系统和电子设备
CN110162780A (zh) 用户意图的识别方法和装置
CN105931639B (zh) 一种支持多级命令词的语音交互方法
US20190095447A1 (en) Method, apparatus, device and storage medium for establishing error correction model based on error correction platform
CN110134496A (zh) 容器监控方法、装置、设备及计算机可读存储介质
CN109215645A (zh) 一种语音信息交互方法以及智能电器
CN110570855A (zh) 通过对话机制控制智能家居设备的系统、方法及装置
CN113330510B (zh) 使用原声词嵌入对直接原声到词的语音识别中的词汇表外的词的识别
CN109545213A (zh) 设备控制方法、装置、存储介质及空调
CN111831795B (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN111968631A (zh) 智能设备的交互方法、装置、设备及存储介质
CN110334268A (zh) 一种区块链项目热词生成方法以及装置
CN109709814A (zh) 一种智能家居中动态构建冲突校验规则表的方法、装置
CN101656692A (zh) 一种远程协作系统和方法
CN110532373A (zh) 金融数据的生成方法、装置、计算机设备及存储介质
CN105808300B (zh) 一种终端的开机方法和装置
CN105808688B (zh) 基于人工智能的补全检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221

RJ01 Rejection of invention patent application after publication