CN108447478A - 一种终端设备的语音控制方法、终端设备及装置 - Google Patents

一种终端设备的语音控制方法、终端设备及装置 Download PDF

Info

Publication number
CN108447478A
CN108447478A CN201810100899.2A CN201810100899A CN108447478A CN 108447478 A CN108447478 A CN 108447478A CN 201810100899 A CN201810100899 A CN 201810100899A CN 108447478 A CN108447478 A CN 108447478A
Authority
CN
China
Prior art keywords
predetermined registration
registration operation
voice messaging
voice
operation instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810100899.2A
Other languages
English (en)
Inventor
王杰
陈统考
黎飞平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JRD Communication Shenzhen Ltd
Original Assignee
JRD Communication Shenzhen Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JRD Communication Shenzhen Ltd filed Critical JRD Communication Shenzhen Ltd
Priority to CN201810100899.2A priority Critical patent/CN108447478A/zh
Publication of CN108447478A publication Critical patent/CN108447478A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Telephone Function (AREA)

Abstract

本申请公开了一种终端设备的语音控制方法、终端设备及装置,该方法用于控制终端设备的设置功能和应用程序,该方法包括:接收第一语音信息,并判断数据库中是否存储有与第一语音信息关联的预设操作指令;在数据库中存储有与第一语音信息关联的预设操作指令时,生成与第一语音信息关联的预设操作指令对应的预设操作指令列表;接收第二语音信息,并判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令;在预设操作指令列表中包含与第二语音信息匹配的预设操作指令时,执行与第二语音信息匹配的预设操作指令对应的操作。通过上述方式,本申请能够方便用户使用并能够提高用户的操作效率。

Description

一种终端设备的语音控制方法、终端设备及装置
技术领域
本申请涉及终端控制技术领域,特别是涉及一种终端设备的语音控制方法、终端设备及装置。
背景技术
在当今的工作和生活中,具有数据处理能力的终端设备已经被广泛使用。尤其是手机、平板电脑等已经成为人们随身携带的必不可少的工具。随着终端设备的处理能力的提高和信息技术的发展,在终端设备上运行的操作终端设备自带的设置功能以及应用程序也越来越多,可以用来实现多种功能。
现有技术中,由于操作终端设备自带的设置功能以及用户后期安装的应用程序较多,因此寻找指定设置功能或应用程序并发出对应的启动指令,或寻找指定功能项并发出对应操作指令,往往需要用户通过多次的人机交互操作来实现。
本申请的发明人在长期的研发过程中,发现上述操作通常需要手指的点击、滑动等操作,这样就会占用用户过多的时间、过多的眼睛关注、以及过多的手指操作。同时,由于长时间不操作,用户容易遗忘相关设置功能的路径,导致操作效率低下。
发明内容
本申请主要解决的技术问题是提供一种终端设备的语音控制方法、终端设备及装置,方便用户使用并能够提高用户的操作效率。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种终端设备的语音控制方法,该方法用于控制终端设备的设置功能和应用程序,该方法包括:接收第一语音信息,并判断数据库中是否存储有与第一语音信息关联的预设操作指令;在数据库中存储有与第一语音信息关联的预设操作指令时,生成与第一语音信息关联的预设操作指令对应的预设操作指令列表;接收第二语音信息,并判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令;在预设操作指令列表中包含与第二语音信息匹配的预设操作指令时,执行与第二语音信息匹配的预设操作指令对应的操作。
其中,在接收第一语音信息步骤之前,该方法包括:接收开启语音控制的指令,并启动语音控制功能。
其中,判断数据库中是否存储有与第一语音信息关联的预设操作指令,包括:接收并分析第一语音信息,获取与第一语音信息对应的第一语音特征数据;判断数据库中是否存储有与第一语音特征数据关联的预设操作指令。
其中,在判断数据库中是否存储有与第一语音特征数据关联的预设操作指令步骤之后,该方法包括:在数据库中没有存储与第一语音特征数据关联的预设操作指令时,获取与第一语音信息对应的第一语义特征数据;判断数据库中是否存储有与第一语义特征数据对应的预设操作指令;在数据库中存储有与第一语义特征数据对应的预设操作指令时,生成与第一语义特征数据关联的预设操作指令对应的预设操作指令列表。
其中,预设操作指令列表包括:与第二语音信息匹配的预设操作指令和对应的自然数序列号。
其中,判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令,包括:接收并分析第二语音信息,获取与第二语音信息对应的第二语音特征数据;判断数据库中是否存储有与第二语音特征数据关联的自然数序列号。
其中,在判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令步骤之后,该方法还包括:若数据库中未存储有与第二语音特征数据关联的自然数序列号,则判断第二语音信息的输入次数是否达到限制次数;在第二语音信息的输入次数达到限制次数时,则结束操作;在第二语音信息的输入次数未达到限制次数时,则重新接收第二语音信息。
其中,该方法还包括:在预设操作指令对应的操作执行失败时,则输出执行失败信息;向服务器反馈执行失败信息。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种终端设备,其特征在于,终端设备包括:处理器、存储器、收发器;处理器耦接存储器和收发器;处理器、存储器、收发器在工作时能够实现上述方法中的步骤。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种具有存储功能的装置,其特征在于,装置存储有程序数据,程序数据能够被处理器执行以实现上述方法中的步骤。
本申请的有益效果是:区别于现有技术的情况,本申请提供一种终端设备的语音控制方法,该方法用于控制终端设备的设置功能和应用程序,该方法包括:接收第一语音信息,并判断数据库中是否存储有与第一语音信息关联的预设操作指令;在数据库中存储有与第一语音信息关联的预设操作指令时,生成与第一语音信息关联的预设操作指令对应的预设操作指令列表;接收第二语音信息,并判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令;在预设操作指令列表中包含与第二语音信息匹配的预设操作指令时,执行与第二语音信息匹配的预设操作指令对应的操作。通过上述方式,本申请可以实现通过对用户输入的第一语音信息和第二语音信息进行识别,以执行该语音指令对应的操作指令,完成对终端的控制,特别是对设置功能和应用程序的控制,使得用户无需手指的点击、滑动等操作,并减少对用户时间的占用、减少用户眼睛对终端过多关注以及减少用户过多的手指操作。同时,用户不需要记忆相关设置功能的路径,直接通过语音选择就能够选定所需要的设置功能,进而方便用户使用,并能够提高用户的操作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请终端设备的语音控制方法一实施方式的流程示意图;
图2是图1中步骤S11的流程示意图;
图3是图2中子步骤S112之后的流程示意图;
图4是图1中步骤S13的流程示意图;
图5是本申请终端设备一实施方式的结构示意图;
图6是本申请具有存储功能的装置一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
参阅图1,图1是本申请终端设备的语音控制方法一实施方式的流程示意图,该终端设备的语音控制方法用于控制终端设备的设置功能和应用程序。该终端设备的语音控制方法包括:
步骤S11:接收第一语音信息,并判断数据库中是否存储有与第一语音信息关联的预设操作指令。
具体地,在本实施方式中,可以根据应用场景设置操作指令与第一语音信息的关联关系,其中第一语音信息为由语音特征组成的语音。
其中,在本实施方式中,在接收到第一语音信息后,终端设备可以对该第一语音信息进行模糊检索匹配,具体可以对该第一语音信息进行语音相近匹配或语义相近匹配。例如,终端设备可以通过语音识别匹配技术,得到与第一语音信息语音最相近的待选语音项;还可以通过语义识别匹配技术,得到与第一语音信息语义最相近的待选语音项。
步骤S12:在数据库中存储有与第一语音信息关联的预设操作指令时,生成与第一语音信息关联的预设操作指令对应的预设操作指令列表。
具体地,在本实施方式中,预设操作指令与第一语音信息的关联关系可以包括:终端设备中指定应用程序的启动指令与相应的第一语音信息的对应关系,其中不同应用程序的启动指令对应不同的语音。
步骤S13:接收第二语音信息,并判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令。
具体地,在本实施方式中,第二语音信息为由语音特征组成的语音。第一语音信息用于提供操作指令,当操作指令的匹配项多于一个时,终端设备将请求用户输入第二语音信息,第二语音信息用于选择具体的操作指令匹配项。终端设备可以通过用户输入的第二语音信息选择需要输出的操作指令匹配项。例如,候选区域中有5个操作指令匹配项,每个操作指令匹配项对应一个序号,如自然数序列号1、2、3、4和5,则用户下达语音指令4,则终端输出序号4对应的操作指令,或是用户直接下达序号1对应的操作指令,则直接输出该操作指令。
步骤S14:在预设操作指令列表中包含与第二语音信息匹配的预设操作指令时,执行与第二语音信息匹配的预设操作指令对应的操作。
具体地,在本实施方式中,预设操作指令与第二语音信息的关联关系可以包括:终端设备中指定应用程序的操作指令与第二语音信息的对应关系;或者每个操作指令匹配项对应一个序号,序号与第二语音信息的对应关系。
通过上述方式,本实施方式可以实现通过对用户输入的第一语音信息和第二语音信息进行识别,以执行该语音指令对应的操作指令,完成对终端的控制,特别是对设置功能和应用程序的控制,使得用户无需手指的点击、滑动等操作,并减少对用户时间的占用、减少用户眼睛对终端过多关注以及减少用户过多的手指操作。同时,用户不需要记忆相关设置功能的路径,直接通过语音选择就能够选定所需要的设置功能,进而方便用户使用,并能够提高用户的操作效率。
其中,在一实施方式中,在步骤S11接收第一语音信息之前,该方法包括:接收开启语音控制的指令,并启动语音控制功能。
具体地,在本实施方式中,可以在监听到预定的触发条件才触发启动语音控制功能。接收开启语音控制的指令可以包括:监听预设按钮的触发操作,当监听到用户对预设按钮的触发操作时,启动语音控制功能;或监听预设手势操作,当监听到终端设备上有预设的手势操作时,启动语音控制功能。在此不做限定。例如,长按home键启动语音控制等。语音控制在第一次启动后可以在后台运行,当时间阈值内没有接收第一语音信息时,则结束语音控制,若需要再次启动语音控制则需重复上述操作。其中,时间阈值可以由用户自定义设置,例如时间阈值为1小时、2小时。
由于检测语音以及语音识别会消耗终端设备电能,而用户的智能终端大多数时间处于待机状态,通过这样处理可以减少对终端设备电能的消耗。
参阅图2,图2是图1中步骤S11的流程示意图。
步骤S11包括:
子步骤S111:接收并分析第一语音信息,获取与第一语音信息对应的第一语音特征数据。
子步骤S112:判断数据库中是否存储有与第一语音特征数据关联的预设操作指令。
具体地,在本实施方式中,将语音相近匹配为第一匹配条件,对第一语音信息进行语音相近匹配以得到第一语音特征数据。第一语音特征数据为与第一语音信息语音相近的待选语音项。终端设备优先检测数据库中是否存储有第一语音特征数据关联的预设操作指令,若存储有第一语音特征数据关联的预设操作指令,则根据匹配度从高到低罗列预设操作指令。
通过上述方式,本实施方式通过简单的语音命令就可以打开指定的应用程序,可以极大地简化用户的操作,提高操作效率。
参阅图3,图3是图2中子步骤S112之后的流程示意图。
子步骤S112之后,该终端设备的语音控制方法还包括:
S113:在数据库中没有存储与第一语音特征数据关联的预设操作指令时,获取与第一语音信息对应的第一语义特征数据。
S114:判断数据库中是否存储有与第一语义特征数据对应的预设操作指令。
S115:在数据库中存储有与第一语义特征数据对应的预设操作指令时,生成与第一语义特征数据关联的预设操作指令对应的预设操作指令列表。
具体地,若数据库中不存在与第一语音特征数据关联的预设操作指令,则终端设备触发语义相近匹配。终端设备对第一语音信息进行语义相近匹配以得到第一语义特征数据。第一语义特征数据为与第一语音信息语义相近的待选语义项。
在其他实施方式中,终端设备也可以以第一语音特征数据的语义为基础,延伸出多个同义词,以多个同义词作为第一语义特征数据。
进一步地,在其他实施方式中,终端设备还可以对多个同义词进行语音相近匹配,在多个同义词中遍历出与第一语音信息语音相近的待选语义项。
若数据库中存储有与第一语义特征数据关联的预设操作指令,则根据匹配度从高到低罗列预设操作指令。若数据库中不存在与第一语义特征数据关联的预设操作指令,则向用户提示匹配失败。
例如,第一语音特征数据可以为通讯录中的联系人名称。终端设备分析第一语音信息,获取与第一语音信息对应的第一语义特征数据。从终端设备的通讯录中查询与该第一语义特征数据匹配的联系人名称,在查询到与该语义匹配的联系人名称后触发对该联系人的语音呼叫。
通过上述方式,本实施方式通过简单的语音命令就可以打开指定的应用程序,可以极大地简化用户的操作,提高操作效率。
其中,在一实施方式中,预设操作指令列表包括:与第二语音信息匹配的预设操作指令和对应的自然数序列号。
具体地,在本实施方式中,当第一次语音匹配得到结果后,若结果为多项,为达到更精准的目标匹配,弹出列表界面让用户再次输入语音完成选择。例如,候选区域中有3个操作指令匹配项,每个操作指令匹配项对应一个序号,如自然数序列号1、2、3,①WIFI、②WIFI设置、③关闭WIFI。
通过上述方式,本实施方式将原本预设操作指令的文字信息转化为简单的数字或字母等简单序号,从而提高一次性输入准确率。
参阅图4,图4是图1中步骤S13的流程示意图。
步骤S13包括:
子步骤S131:接收并分析第二语音信息,获取与第二语音信息对应的第二语音特征数据。
子步骤S132:判断数据库中是否存储有与第二语音特征数据关联的自然数序列号。
具体地,在本实施方式中,对第二语音信息进行语音相近匹配以得到第二语音特征数据。第二语音特征数据为与第二语音信息语音相近的待选语音项。终端设备优先检测数据库中是否存储有第二语音特征数据关联的自然数序列号,若存储有第二语音特征数据关联的自然数序列号,则执行该自然数序列号对应的操作指令。在其他实施方式中,第二语音信息可以是选择候选区域中的候选预设操作指令对应的序号的指令,也可以是对候选区域进行翻页的指令,或是选择候选预设操作指令的语音指令。
终端设备判断数据库中是否存储有与第二语音特征数据关联的自然数序列号。例如,用户下达“2”的第二语音信息,终端设备接收到该第二语音信息后,终端设备对该第二语音信息进行语音识别,当识别到该第二语音信息为“2”时,则判断数据库中是否存储有与第二语音特征数据关联的自然数序列号。例如用户语音输入“2”,数据库中存储有①WIFI、②WIFI设置、③关闭WIFI,则选择候选区域中序号“2”对应的预设操作指令,即可打开WIFI设置界面。
其中,在步骤S13之后,该终端设备的语音控制方法还包括:
若数据库中未存储有与第二语音特征数据关联的自然数序列号,则判断第二语音信息的输入次数是否达到限制次数。在第二语音信息的输入次数达到限制次数时,则结束操作;在第二语音信息的输入次数未达到限制次数时,则重新接收第二语音信息。
具体地,在本实施方式中,限制次数可以由用户自定义设置,例如,限制次数为2次、3次、4次。在此不做限制。
其中,在一实施方式中,该方法还包括:在预设操作指令对应的操作执行失败时,则输出执行失败信息,并向服务器反馈执行失败信息。
具体地,在本实施方式中,预设操作指令执行失败可以由设置功能或应用程序的故障导致。终端设备可以通过无线网络、数据通信、或数据线向服务器反馈执行失败信息。
参阅图5,图5是本申请终端设备一实施方式的结构示意图。其中,终端设备10可以为个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能手机、掌上电脑、平板电脑、个人数字助理器(PDA,Personal Digital Assistant)等。这些终端设备上都安装有操作终端设备,包括但不限于:Android操作终端设备、Symbian操作终端设备、Windows mobile操作终端设备、以及苹果iPhone OS操作终端设备等等。
终端设备10包括:处理器11、存储器12、收发器13;处理器11耦接存储器12和收发器13;处理器11、存储器12、收发器13在工作时能够实现上述方法中的步骤。
收发器13用于接收第一语音信息。
处理器11用于判断数据库中是否存储有与第一语音信息关联的预设操作指令。在数据库中存储有与第一语音信息关联的预设操作指令时,处理器11生成与第一语音信息关联的预设操作指令对应的预设操作指令列表。
收发器13还用于接收第二语音信息。
处理器11还用于判断预设操作指令列表中是否包含与第二语音信息匹配的预设操作指令。在预设操作指令列表中包含与第二语音信息匹配的预设操作指令时,处理器11执行与第二语音信息匹配的预设操作指令对应的操作。
存储器12用于存储预设操作指令、预设操作指令列表、第一语音信息、第二语音信息。
其中,收发器13还用于接收开启语音控制的指令,在接收到开启语音控制的指令后,处理器11启动语音控制功能。
其中,处理器11分析第一语音信息,并获取与第一语音信息对应的第一语音特征数据,处理器11判断数据库中是否存储有与第一语音特征数据关联的预设操作指令。
其中,在数据库中没有存储与第一语音特征数据关联的预设操作指令时,处理器11获取与第一语音信息对应的第一语义特征数据。处理器11判断数据库中是否存储有与第一语义特征数据对应的预设操作指令,在数据库中存储有与第一语义特征数据对应的预设操作指令时,处理器11生成与第一语义特征数据关联的预设操作指令对应的预设操作指令列表。
其中,处理器11分析第二语音信息,并获取与第二语音信息对应的第二语音特征数据,处理器11判断数据库中是否存储有与第二语音特征数据关联的自然数序列号。
存储器12用于存储与第二语音特征数据关联的自然数序列号。
其中,若数据库中未存储有与第二语音特征数据关联的自然数序列号,则处理器11判断第二语音信息的输入次数是否达到限制次数。若是,则处理器11结束操作;若否,则收发器13重新接收第二语音信息。
其中,在预设操作指令对应的操作执行失败时,则处理器11输出执行失败信息,收发器13向服务器反馈该执行失败信息。
需要说明的是,本实施方式的终端设备10可以执行上述方法中的步骤,相关内容的详细说明请参见上述方法部分,在此不再赘叙。
通过上述方式,本实施方式可以实现通过对用户输入的第一语音信息和第二语音信息进行识别,以执行该语音指令对应的操作指令,完成对终端的控制,特别是对设置功能和应用程序的控制,使得用户无需手指的点击、滑动等操作,并减少对用户时间的占用、减少用户眼睛对终端过多关注以及减少用户过多的手指操作。同时,用户不需要记忆相关设置功能的路径,直接通过语音选择就能够选定所需要的设置功能,进而方便用户使用,并能够提高用户的操作效率。
参阅图6,图6是本申请具有存储功能的装置一实施方式的结构示意图。本实施方式中,一种具有存储功能的装置40,存储有程序数据41,该程序数据41能够被执行以实现如上述实施方式中的步骤,相关内容的详细说明请参见上述方法部分,在此不再赘述。
该程序数据41能够被计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行以实现本申请语音指令自动化测试方法的全部或部分步骤。而前述的具有存储功能的装置40包括:服务器、U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的装置。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种终端设备的语音控制方法,其特征在于,所述方法用于控制所述终端设备的设置功能和应用程序,所述方法包括:
接收第一语音信息,并判断数据库中是否存储有与所述第一语音信息关联的预设操作指令;
在所述数据库中存储有与所述第一语音信息关联的所述预设操作指令时,生成与所述第一语音信息关联的所述预设操作指令对应的预设操作指令列表;
接收第二语音信息,并判断所述预设操作指令列表中是否包含与所述第二语音信息匹配的预设操作指令;
在所述预设操作指令列表中包含与所述第二语音信息匹配的所述预设操作指令时,执行与所述第二语音信息匹配的所述预设操作指令对应的操作。
2.根据权利要求1所述的方法,其特征在于,在所述接收第一语音信息步骤之前,所述方法包括:
接收开启语音控制的指令,并启动语音控制功能。
3.根据权利要求1所述的方法,其特征在于,所述判断数据库中是否存储有与所述第一语音信息关联的预设操作指令,包括:
接收并分析所述第一语音信息,获取与所述第一语音信息对应的第一语音特征数据;
判断所述数据库中是否存储有与所述第一语音特征数据关联的所述预设操作指令。
4.根据权利要求3所述的方法,其特征在于,在所述判断所述数据库中是否存储有与所述第一语音特征数据关联的所述预设操作指令步骤之后,所述方法包括:
在所述数据库中没有存储与所述第一语音特征数据关联的所述预设操作指令时,获取与所述第一语音信息对应的第一语义特征数据;
判断所述数据库中是否存储有与所述第一语义特征数据对应的所述预设操作指令;
在所述数据库中存储有与所述第一语义特征数据对应的所述预设操作指令时,生成与所述第一语义特征数据关联的所述预设操作指令对应的预设操作指令列表。
5.根据权利要求1所述的方法,其特征在于,所述预设操作指令列表包括:与所述第二语音信息匹配的所述预设操作指令和对应的自然数序列号。
6.根据权利要求5所述的方法,其特征在于,所述判断所述预设操作指令列表中是否包含与所述第二语音信息匹配的预设操作指令,包括:
接收并分析所述第二语音信息,获取与所述第二语音信息对应的第二语音特征数据;
判断所述数据库中是否存储有与所述第二语音特征数据关联的所述自然数序列号。
7.根据权利要求6所述的方法,其特征在于,在所述判断所述预设操作指令列表中是否包含与所述第二语音信息匹配的预设操作指令步骤之后,所述方法还包括:
若所述数据库中未存储有与所述第二语音特征数据关联的所述自然数序列号,则判断所述第二语音信息的输入次数是否达到限制次数;
在所述第二语音信息的输入次数达到所述限制次数时,则结束操作;
在所述第二语音信息的输入次数未达到所述限制次数时,则重新接收第二语音信息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述预设操作指令对应的操作执行失败时,则输出执行失败信息,并向服务器反馈所述执行失败信息。
9.一种终端设备,其特征在于,所述终端设备包括:处理器、存储器、收发器;所述处理器耦接所述存储器和所述收发器;所述处理器、所述存储器、所述收发器在工作时能够实现如权利要求1-8任一项所述方法中的步骤。
10.一种具有存储功能的装置,其特征在于,所述装置存储有程序数据,所述程序数据能够被处理器执行以实现如权利要求1-8任一项所述的方法中的步骤。
CN201810100899.2A 2018-01-31 2018-01-31 一种终端设备的语音控制方法、终端设备及装置 Pending CN108447478A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810100899.2A CN108447478A (zh) 2018-01-31 2018-01-31 一种终端设备的语音控制方法、终端设备及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810100899.2A CN108447478A (zh) 2018-01-31 2018-01-31 一种终端设备的语音控制方法、终端设备及装置

Publications (1)

Publication Number Publication Date
CN108447478A true CN108447478A (zh) 2018-08-24

Family

ID=63191611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810100899.2A Pending CN108447478A (zh) 2018-01-31 2018-01-31 一种终端设备的语音控制方法、终端设备及装置

Country Status (1)

Country Link
CN (1) CN108447478A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299223A (zh) * 2018-10-15 2019-02-01 百度在线网络技术(北京)有限公司 用于查询指令的方法及装置
CN110136700A (zh) * 2019-03-15 2019-08-16 湖北亿咖通科技有限公司 一种语音信息处理方法及装置
CN110286986A (zh) * 2019-06-27 2019-09-27 新华网(北京)科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
WO2022156246A1 (zh) * 2021-01-21 2022-07-28 海信视像科技股份有限公司 语音指令处理电路、接收装置、服务器、语音指令的累积系统和累积方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299223A (zh) * 2018-10-15 2019-02-01 百度在线网络技术(北京)有限公司 用于查询指令的方法及装置
CN109299223B (zh) * 2018-10-15 2020-05-15 百度在线网络技术(北京)有限公司 用于查询指令的方法及装置
CN110136700A (zh) * 2019-03-15 2019-08-16 湖北亿咖通科技有限公司 一种语音信息处理方法及装置
CN110136700B (zh) * 2019-03-15 2021-04-20 湖北亿咖通科技有限公司 一种语音信息处理方法及装置
CN110286986A (zh) * 2019-06-27 2019-09-27 新华网(北京)科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
WO2022156246A1 (zh) * 2021-01-21 2022-07-28 海信视像科技股份有限公司 语音指令处理电路、接收装置、服务器、语音指令的累积系统和累积方法

Similar Documents

Publication Publication Date Title
US11030412B2 (en) System and method for chatbot conversation construction and management
RU2699399C2 (ru) Система и способ обнаружения орфанных высказываний
CN103280216B (zh) 改进依赖上下文的语音识别器对环境变化的鲁棒性
RU2571608C2 (ru) Создание заметок с использованием голосового потока
CN108447478A (zh) 一种终端设备的语音控制方法、终端设备及装置
EP3655863A1 (en) Automatic integration of image capture and recognition in a voice-based query to understand intent
CN108009521A (zh) 人脸图像匹配方法、装置、终端及存储介质
CN111970409B (zh) 基于人机交互的语音处理方法、装置、设备和存储介质
CN107331400A (zh) 一种声纹识别性能提升方法、装置、终端及存储介质
CN110459222A (zh) 语音控制方法、语音控制装置及终端设备
US11657800B2 (en) Electronic device with wakeup word determined multi-mode operation
US12069019B2 (en) Topic overlap detection in messaging systems
KR20190109916A (ko) 전자 장치 및 상기 전자 장치로부터 수신된 데이터를 처리하는 서버
CN110047484A (zh) 一种语音识别交互方法、系统、设备和存储介质
CN107799115A (zh) 一种语音识别方法及装置
CN109448727A (zh) 语音交互方法以及装置
US20220269724A1 (en) Audio playing method, electronic device, and storage medium
CN108924343A (zh) 电子设备控制方法、装置、存储介质及电子设备
CN112562684A (zh) 一种语音识别方法、装置和电子设备
CN107172258A (zh) 一种保存联系人信息的方法、装置、终端及存储介质
CN108231074A (zh) 一种数据处理方法、语音助手设备及计算机可读存储介质
US10282417B2 (en) Conversational list management
CN108762712A (zh) 电子设备控制方法、装置、存储介质及电子设备
CN107515666A (zh) 一种数据管理方法及终端
CN109725798A (zh) 智能角色的切换方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180824

RJ01 Rejection of invention patent application after publication