CN106251863B - 一种基于智能设备的指令式语音控制系统及控制方法 - Google Patents
一种基于智能设备的指令式语音控制系统及控制方法 Download PDFInfo
- Publication number
- CN106251863B CN106251863B CN201610589347.3A CN201610589347A CN106251863B CN 106251863 B CN106251863 B CN 106251863B CN 201610589347 A CN201610589347 A CN 201610589347A CN 106251863 B CN106251863 B CN 106251863B
- Authority
- CN
- China
- Prior art keywords
- instruction
- module
- node
- storehouse
- control system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 65
- 230000002452 interceptive effect Effects 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 61
- 230000008569 process Effects 0.000 claims description 52
- 230000004044 response Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 11
- 238000012790 confirmation Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000006722 reduction reaction Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72469—User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72484—User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种基于智能设备的指令式语音控制系统,该控制系统包括语音交互系统和指令控制系统,所述语音交互系统包括语音采集模块、语音识别模块、指令解析模块和指令提醒模块;所述指令控制系统包括指令匹配模块、指令响应模块、指令集堆栈和操控引导模块;与现有技术相比,本发明为智能设备提供一套口令操控系统,让用户在不方便用手操控,用眼睛观看的时候,也能够跟智能设备进行交互,对其进行操控。提高了智能设备的适用范围和环境,大大减小误判率,提高整个智能设备操控的精准性。
Description
技术领域
本发明属于语音控制领域,特别是涉及一种基于智能设备的指令式语音控制系统及控制方法。
背景技术
当今社会智能设备无处不在,手机、平板、车载系统等等。目前的智能设备的一个主要交互方式就是触摸屏,用户点触屏进行操控,系统把操作结果反馈到屏幕上。但实际生活中,经常会遇到手或眼睛被占用,不方便操作这些设备的情况。特别是在驾驶过程中,如果需要联系某人或者查找地址信息,操作起来十分不便,而且非常危险。目前也有人工智能语音识别的系统,不过由于语音识别与人工智能发展的局限性,效果并不理想,识别的错误率极高,很难用于实际应用。
发明内容
针对现有技术中存在的问题,本发明提供一种基于智能设备的指令式语音控制系统及控制方法,能够通过基本语音口令来操控智能设备,并得到语音反馈,而且识别的准确率较高。
为实现上述目的,本发明采用以下技术方案:
一种基于智能设备的指令式语音控制系统,该控制系统包括语音交互系统和指令控制系统,在所述指令式语音控制系统中预先设置指令预定义数据;
所述语音交互系统包括语音采集模块、语音识别模块、指令解析模块和指令提醒模块;
所述指令控制系统包括指令匹配模块、指令响应模块、指令集堆栈和操控引导模块;
所述语音采集模块监听采集声音输入,并将声音信号进行降噪、过滤、压缩处理后,生成声音采样,传输给语音识别模块,所述语音识别模块将输入的声音采样,转化为文字信息,将文字信息传给指令解析模块,指令解析模块从文字信息中解析出拼音编码,并根据预定义的映射关系得到此拼音编码所对应的指令编码,并将指令编码传给指令控制系统中的指令匹配模块,所述指令匹配模块将传入的指令编码跟指令集堆栈栈顶指令集中的指令进行匹配,并将匹配到的指令数据传递给指令响应模块,所述指令响应模块根据指令数据中所定义的指令类型进行不同的响应处理;
还包括触屏交互系统,所述触屏交互系统包括触控响应模块和指令显示模块,所示指令显示模块所显示的指令按钮数量等同于系统所使用的指令编码的数量,所述指令显示模块展示指令集堆栈栈顶的指令信息,包括指令名称、功能名称、堆栈层级信息,在指令显示模块中的指令按钮上显示指令名称,指令按钮的一侧显示功能名称。
语音交互系统中内置了有限固定数量的指令编码,并且内置了指令编码与拼音编码的映射关系,每一条指令编码映射一条或多条拼音编码。
所述文字信息和拼音编码包括预先定义的应用于系统支持的语言资源。
所述指令预定义数据以树状结构存储,所述树状结构中的每个结点中都存储着数量固定的一套指令数据,且各个结点中所使用的指令编码的集合相同,所述结点中每条指令数据存储的内容为:指令编码、指令类型、功能名称和元数据,所述同一结点中各个指令数据中的指令编码均不重复;所述指令预定义数据中的指令类型包括:进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令。
所述指令预定义数据中使用的指令编码在应用于同一智能设备或同一个应用中,指令编码的数量为有限固定个数。
所述指令编码的数量为4-12个,触屏交互系统中的屏幕尺寸会影响所需指令编码的数量,如果智能设备没有屏幕或者屏幕较大,则可以采用12条指令编码;如果智能设备的屏幕较小,为了便于浏览和交互操作,则要减少指令编码的使用数量,但最少不能少于4条。
指令集堆栈中结点的数据与指令预定义数据中的结点之间为引用关系,系统初始化时,用指令预定义数据中的根结点来初始化指令集堆栈的初始结点,之后每次所压入指令集堆栈的数据均需引用预定义数据中的一个结点。
所述指令响应模块响应处理方式为:
a)如果是进栈指令,先获取指令数据中所指向的预定义数据中的结点,引导模块根据此结点数据创建新的堆栈结点,并将其压栈,同时通知指令显示模块更新信息显示;
b)如果是出栈指令,则直接通知控制引导模块,控制引导模块将指令集堆栈的栈顶结点出栈,同时通知指令显示模块更新信息显示;当指令集堆栈只有一个结点时,出栈指令不做响应;
c)如果是功能指令,就通知功能执行模块,功能执行模块执行具体功能。
所述指令式语音控制系统中设置一个内置指令,此内置指令有两种功能响应:
a)当系统未激活或进入休眠时,此指令用于激活系统;
b)当系统激活后,指令响应模块接收到此指令,会将指令集堆栈栈顶结点的信息传给指令提醒模块,指令提醒模块语音播报当前栈顶结点中各个指令的功能名称。
一种基于智能设备的指令式语音控制系统的控制方法,该控制方法包括以下步骤:
a、首先,执行开启语音控制/打开APP过程,此过程开启功能或者启动程序;
b、之后,初始化指令集过程,根据指令预定义数据进行初始化操作,指令集堆栈初始化到第一级堆栈;
c、之后,更新显示当前级指令集过程,将指令显示模块刷新为指令集堆栈栈顶的指令信息;
d、之后,监听响应语音指令过程,等待来自于通过指令匹配模块的指令数据输入;
e、当监测到一条指令数据输入后,通过判断指令类型过程,对指令类型进行判断,根据指令类型进行不同的处理;
f、如果是进栈指令,则执行下一级指令集进入堆栈过程,将次指令数据中所引用的指令集压入堆栈,然后去执行更新显示当前级指令集过程;
g、如果是出栈指令,则将执行当前指令集出栈,返回上一级指令集过程,此过程将指令集堆栈的栈顶结点出栈,新的栈顶指令集作为当前指令集,之后执行更新显示当前级指令集过程;
h、如果是功能类的指令,则先执行是否需要确认过程,判断是否需要执行确认,对于需要进行确认的功能类指令,要先执行监听响应确认指令过程,监听响应确认指令过程,等待来自于通过指令响应模块的指令输入;如果下达否定指令,则返回监听响应语音指令过程;如果下达肯定指令,则开始执行功能过程,对于不需要进行确认的功能类指令,则直接开始执行功能过程;
i、执行功能过程之后,返回监听响应语音指令过程,等待后续的指令数据输入。
本发明中拼音编码可以为数字、字母等能识别的语言、字符或汉字,具体可以采用10个数字、是”、“否”两个字作为指令集,具体数字可采用:0、1、2、3、4、5、6、7、8、9,指令0表示返回上一级堆栈,是”、“否”分别用于对功能执行的确认或取消;使用会大大提高识别度和认知度,或者根据具体需要采用不同的字符或汉字。
本发明中12条指令编码,指令显示模块显示的指令编码数至少为4个,为了满足进度指令:上级、下级及功能确定和取消的操作,根据智能设备屏幕的大小不同,可以选择显示不同数量的指令。应用于手机、平板设备、电脑、车载系统,显示模块每层显示12个指令;应用于智能手表、AR眼镜设备,显示模块每层显示4~6个指令。针对不同的设备显示不同数量的指令,增加显示的效果性。
本发明中指令显示说明模块:用于展示在当前指令级别的各个指令及其功能名称。指令说明以图标的方式排列展示,图标上显示指令名称,指令名称在图标内,显示清晰。当前可用的指令高亮,不可用指令变暗。图标下方显示指令功能名称;显示层级列表,用以帮助用户导航。指令发音可以支持不同的语言,针对当前级的指令功能,给使用者进行界面展示和语音提示说明,无屏幕智能设备,只进行语音提示说明。
本发明对于可用指令的图标、指令名、指令功能名称进行放大显示,不可用指令图标缩小或者隐藏;语音提示模块,菜单语音播报,适用于不方便用眼睛观看指令功能的时候,系统自动播报当前上下文的指令功能。
本发明中:①进栈指令:定义数据中引用一个子结点,当执行此指令后,其引用的子结点所对应的指令集进栈;②出栈指令:表示执行此指令后,此指令所在的结点出栈,返回到其父结点。如果本结点是根结点则无响应;③功能指令:表示此指令对应的是用户要操作使用的一个应用级的功能。具体功能由使用此方法和系统的应用或设备自行定义实现;④无效指令:表示在本结点中此指令不做任何响应。
与现有技术相比,本发明为智能设备提供一套口令操控系统,让用户在不方便用手操控,用眼睛观看的时候,也能够跟智能设备进行交互,对其进行操控。提高了智能设备的适用范围和环境,大大减小误判率,提高整个智能设备操控的精准性。而且,本发明不需要记忆和猜测下达指令的关键词、指令固定、简单,所以指令下达简单、迅速识别库非常小,减小系统的大小,由于识别库小,可以集成到设备中,脱离网络。
附图说明
图1为本发明的系统模块图。
图2为本发明的指令控制流程图。
图3为本发明在手机、平板电脑、车载电脑设备上的界面示意图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明技术方案:
如图1-3所示,本实施例基于智能设备的指令式语音控制系统,其特征在于,该控制系统包括语音交互系统12和指令控制系统16,所述指令式语音控制系统中预先设置指令预定义数据175,
所述语音交互系统12包括语音采集模块110、语音识别模块120、指令解析模块130和指令提醒模块140;
所述指令控制系统16包括指令匹配模块170、指令响应模块180、指令集堆栈185和操控引导模块190;所述指令式语音控制系统中设置一个内置指令,此内置指令有两种功能响应:
a)当系统未激活或进入休眠时,此指令用于激活系统;
b)当系统激活后,指令响应模块180接收到此指令,会将指令集堆栈185栈顶结点的信息传给指令提醒模块140,指令提醒模块140语音播报当前栈顶结点中各个指令的功能名称。
所述语音采集模块110监听采集声音输入,并将声音信号进行降噪、过滤、压缩处理后,生成声音采样a10,传输给语音识别模块120,所述语音识别模块120将输入的声音采样a10,转化为文字信息a20,将文字信息a20传给指令解析模块130,指令解析模块130从文字信息a20中解析出拼音编码a30,并根据预定义的映射关系得到此拼音编码a30所对应的指令编码a40,并将指令编码a40传给指令控制系统16中的指令匹配模块170,所述指令匹配模块170将传入的指令编码a40跟指令集堆栈185栈顶指令集中的指令进行匹配,并将匹配到的指令数据a50传递给指令响应模块180,所述指令响应模块180根据指令数据a50中所定义的指令类型进行不同的响应处理。
作为优选,本实施例还包括触屏交互系统14,所述触屏交互系统14包括触控响应模块150和指令显示模块160,所示指令显示模块160所显示的指令按钮数量等同于系统所使用的指令编码a40的数量,所述指令显示模块160展示指令集堆栈185栈顶的指令信息,包括指令名称b1、功能名称b2、堆栈层级b3信息,在指令显示模块160中的指令按钮上显示指令名称b1,指令按钮的一侧显示功能名称b2。
本实施例语音交互系统12中内置了有限固定数量的指令编码a40,并且内置了指令编码a40与拼音编码a30的映射关系,每一条指令编码a40映射一条或多条拼音编码a30。
作为优选,本实施例中所述文字信息a20和拼音编码a30包括预先定义的应用于系统支持的语言资源。
本实施例所述指令预定义数据175以树状结构存储,所述树状结构中的每个结点中都存储着数量固定的一套指令数据,且各个结点中所使用的指令编码a40的集合相同,所述结点中每条指令数据存储的内容为:指令编码a40、指令类型、功能名称和元数据,所述同一结点中各个指令数据中的指令编码a40均不重复;所述指令预定义数据175中的指令类型包括:进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令;所述指令预定义数据175中使用的指令编码a40在应用于同一智能设备或同一个应用中,指令编码a40的数量为有限固定个数,根据不同的智能设备所述指令编码a40的数量为4-12个。
所述指令预定义数据175中使用的指令编码a40在应用于同一智能设备或同一个应用中,指令编码a40的数量为有限固定个数。
本实施例中指令集堆栈185中结点的数据与指令预定义数据175中的结点之间为引用关系,系统初始化时,用指令预定义数据175中的根结点来初始化指令集堆栈185的初始结点,之后每次所压入指令集堆栈185的数据均需引用预定义数据175中的一个结点。
本实施例指令响应模块180根据指令数据a50中所定义的指令类型进行不同的响应处理,指令响应模块180响应处理方式为:
a)如果是进栈指令,先获取指令数据a50中所指向的预定义数据175中的结点,引导模块190根据此结点数据创建新的堆栈结点,并将其压栈,同时通知指令显示模块160更新信息显示;
b)如果是出栈指令,则直接通知控制引导模块190,控制引导模块190将指令集堆栈185的栈顶结点出栈,同时通知指令显示模块160更新信息显示;当指令集堆栈185只有一个结点时,出栈指令不做响应;
c)如果是功能指令,就通知功能执行模块195,功能执行模块195执行具体功能。
如图3所示,本实施例在手机、平板电脑、车载电脑设备上的界面示意图,所述指令显示模块160展示指令集堆栈185栈顶的指令信息,包括指令名称b1、功能名称b2、堆栈层级b3信息。
本实施例一种基于智能设备的指令式语音控制系统的控制方法,该控制方法包括以下步骤:
a、首先,执行开启语音控制/打开APP210过程,此过程开启功能或者启动程序;
b、之后,初始化指令集220过程,根据指令预定义数据175进行初始化操作,指令集堆栈185初始化到第一级堆栈;
c、之后,更新显示当前级指令集230过程,将指令显示模块160刷新为指令集堆栈185栈顶的指令信息;
d、之后,监听响应语音指令240过程,等待来自于通过指令匹配模块170的指令数据a50输入;
e、当监测到一条指令数据a50输入后,通过判断指令类型250过程,对指令类型进行判断,根据指令类型进行不同的处理;
f、如果是进栈指令,则执行下一级指令集进入堆栈254过程,将此指令数据a50中所引用的指令集压入堆栈,然后去执行更新显示当前级指令集230过程;
g、如果是出栈指令,则将执行当前指令集出栈,返回上一级指令集252过程,此过程将指令集堆栈185的栈顶结点出栈,新的栈顶指令集作为当前指令集,之后执行更新显示当前级指令集230过程;
h、如果是功能类的指令,则先执行是否需要确认260过程,判断是否需要执行确认,对于需要进行确认的功能类指令,要先执行监听响应确认指令262过程,监听响应确认指令262过程,等待来自于通过指令响应模块180的指令输入;如果下达否定指令,则返回监听响应语音指令240过程;如果下达肯定指令,则开始执行功能270过程,对于不需要进行确认的功能类指令,则直接开始执行功能270过程;
i、执行功能270过程之后,返回监听响应语音指令240过程,等待后续的指令数据a50输入。
尽管上述实施例已对本发明作出具体描述,但是对于本领域的普通技术人员来说,应该理解为可以在不脱离本发明的精神以及范围之内基于本发明公开的内容进行修改或改进,这些修改和改进都在本发明的精神以及范围之内。
Claims (5)
1.一种基于智能设备的指令式语音控制系统,其特征在于,该控制系统包括语音交互系统(12)和指令控制系统(16),在所述指令式语音控制系统中预先设置指令预定义数据(175),
所述语音交互系统(12)包括语音采集模块(110)、语音识别模块(120)、指令解析模块(130)和指令提醒模块(140);
所述指令控制系统(16)包括指令匹配模块(170)、指令响应模块(180)、指令集堆栈(185)和操控引导模块(190);
所述语音采集模块(110)监听采集声音输入,并将声音信号进行降噪、过滤、压缩处理后,生成声音采样(a10),传输给语音识别模块(120),所述语音识别模块(120)将输入的声音采样(a10),转化为文字信息(a20),将文字信息(a20)传给指令解析模块(130),指令解析模块(130)从文字信息(a20)中解析出拼音编码(a30),并根据预定义的映射关系得到此拼音编码(a30)所对应的指令编码(a40),并将指令编码(a40)传给指令控制系统(16)中的指令匹配模块(170),所述指令匹配模块(170)将传入的指令编码(a40)跟指令集堆栈(185)栈顶指令集中的指令进行匹配,并将匹配到的指令数据(a50)传递给指令响应模块(180),所述指令响应模块(180)根据指令数据(a50)中所定义的指令类型进行不同的响应处理;
还包括触屏交互系统(14),所述触屏交互系统(14)包括触控响应模块(150)和指令显示模块(160),所示指令显示模块(160)所显示的指令按钮数量等同于系统所使用的指令编码(a40)的数量,所述指令显示模块(160)展示指令集堆栈(185)栈顶的指令信息,包括指令名称(b1)、功能名称(b2)、堆栈层级(b3)信息,在指令显示模块(160)中的指令按钮上显示指令名称(b1),指令按钮的一侧显示功能名称(b2);所述语音交互系统(12)中内置了有限固定数量的指令编码(a40),并且内置了指令编码(a40)与拼音编码(a30)的映射关系,每一条指令编码(a40)映射一条或多条拼音编码(a30);所述文字信息(a20)和拼音编码(a30)包括预先定义的应用于系统支持的语言资源;所述指令预定义数据(175)以树状结构存储,所述树状结构中的每个结点中都存储着数量固定的一套指令数据,且各个结点中所使用的指令编码(a40)的集合相同,结点中每条指令数据存储的内容为:指令编码(a40)、指令类型、功能名称和元数据,同一结点中各个指令数据中的指令编码(a40)均不重复;所述指令预定义数据(175)中的指令类型包括:进栈指令、出栈指令、肯定指令、否定指令、功能指令、无效指令;
所述指令集堆栈(185)中结点的数据与指令预定义数据(175)中的结点之间为引用关系,系统初始化时,用指令预定义数据(175)中的根结点来初始化指令集堆栈(185)的初始结点,之后每次所压入指令集堆栈(185)的数据均需引用预定义数据(175)中的一个结点;所述指令响应模块(180)响应处理方式为:
a)如果是进栈指令,先获取指令数据(a50)中所指向的预定义数据(175)中的结点,引导模块(190)根据此结点数据创建新的堆栈结点,并将其压栈,同时通知指令显示模块(160)更新信息显示;
b)如果是出栈指令,则直接通知控制引导模块(190),控制引导模块(190)将指令集堆栈(185)的栈顶结点出栈,同时通知指令显示模块(160)更新信息显示;当指令集堆栈(185)只有一个结点时,出栈指令不做响应;
c)如果是功能指令,就通知功能执行模块(195),功能执行模块(195)执行具体功能。
2.根据权利要求1所述的基于智能设备的指令式语音控制系统,其特征在于,所述指令预定义数据(175)中使用的指令编码(a40)在应用于同一智能设备或同一个应用中,指令编码(a40)的数量为有限固定个数。
3.根据权利要求2所述的基于智能设备的指令式语音控制系统,其特征在于,所述指令编码(a40)的数量为4-12个。
4.根据权利要求1所述的基于智能设备的指令式语音控制系统,其特征在于,所述指令式语音控制系统中设置一个内置指令,此内置指令有两种功能响应:
a)当系统未激活或进入休眠时,此指令用于激活系统;
b)当系统激活后,指令响应模块(180)接收到此指令,会将指令集堆栈(185)栈顶结点的信息传给指令提醒模块(140),指令提醒模块(140)语音播报当前栈顶结点中各个指令的功能名称。
5.一种权利要求1所述的基于智能设备的指令式语音控制系统的控制方法,其特征在于,该控制方法包括以下步骤:
a、首先,执行开启语音控制/打开APP(210)过程,此过程开启功能或者启动程序;
b、之后,初始化指令集(220)过程,根据指令预定义数据(175)进行初始化操作,指令集堆栈(185)初始化到第一级堆栈;
c、之后,更新显示当前级指令集(230)过程,将指令显示模块(160)刷新为指令集堆栈(185)栈顶的指令信息;
d、之后,监听响应语音指令(240)过程,等待来自于通过指令匹配模块(170)的指令数据(a50)输入;
e、当监测到一条指令数据(a50)输入后,通过判断指令类型(250)过程,对指令类型进行判断,根据指令类型进行不同的处理;
f、如果是进栈指令,则执行下一级指令集进入堆栈(254)过程,将此指令数据(a50)中所引用的指令集压入堆栈,然后去执行更新显示当前级指令集(230)过程;
g、如果是出栈指令,则将执行当前指令集出栈,返回上一级指令集(252)过程,此过程将指令集堆栈(185)的栈顶结点出栈,新的栈顶指令集作为当前指令集,之后执行更新显示当前级指令集(230)过程;
h、如果是功能类的指令,则先执行是否需要确认(260)过程,判断是否需要执行确认,对于需要进行确认的功能类指令,要先执行监听响应确认指令(262)过程,监听响应确认指令(262)过程,等待来自于通过指令响应模块(180)的指令输入;如果下达否定指令,则返回监听响应语音指令(240)过程;如果下达肯定指令,则开始执行功能(270)过程, 对于不需要进行确认的功能类指令,则直接开始执行功能(270)过程;
i、执行功能(270)过程之后,返回监听响应语音指令(240)过程,等待后续的指令数据(a50)输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610589347.3A CN106251863B (zh) | 2016-07-26 | 2016-07-26 | 一种基于智能设备的指令式语音控制系统及控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610589347.3A CN106251863B (zh) | 2016-07-26 | 2016-07-26 | 一种基于智能设备的指令式语音控制系统及控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106251863A CN106251863A (zh) | 2016-12-21 |
CN106251863B true CN106251863B (zh) | 2019-05-24 |
Family
ID=57603929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610589347.3A Active CN106251863B (zh) | 2016-07-26 | 2016-07-26 | 一种基于智能设备的指令式语音控制系统及控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106251863B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106843814B (zh) * | 2016-12-28 | 2018-11-23 | 北京智能管家科技有限公司 | 用于机器人系统交互的多指令处理方法及装置 |
CN107507623A (zh) * | 2017-10-09 | 2017-12-22 | 维拓智能科技(深圳)有限公司 | 基于麦克风阵列语音交互的自助服务终端 |
CN109903769A (zh) * | 2017-12-08 | 2019-06-18 | Tcl集团股份有限公司 | 一种终端设备交互的方法、装置和终端设备 |
CN108228064B (zh) * | 2018-01-22 | 2020-11-24 | 西门子工厂自动化工程有限公司 | 数据监视控制方法、装置及计算机存储介质 |
CN108682419A (zh) * | 2018-03-30 | 2018-10-19 | 京东方科技集团股份有限公司 | 语音控制方法及设备、计算机可读存储介质及设备 |
CN108766427B (zh) * | 2018-05-31 | 2020-10-16 | 北京小米移动软件有限公司 | 语音控制方法及装置 |
CN109299223B (zh) * | 2018-10-15 | 2020-05-15 | 百度在线网络技术(北京)有限公司 | 用于查询指令的方法及装置 |
CN109107006B (zh) * | 2018-10-23 | 2021-01-08 | 奥利加尔国际(重庆)科技发展有限公司 | 一种智能雾化器及其使用方法和雾化管理系统 |
CN116303697B (zh) * | 2023-05-18 | 2023-08-08 | 深圳鹏锐信息技术股份有限公司 | 一种基于人工智能的模型展示系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8694620B2 (en) * | 2003-09-08 | 2014-04-08 | Microsoft Corporation | System and method for an OMA DM extension to manage mobile device configuration settings |
JP2007164505A (ja) * | 2005-12-14 | 2007-06-28 | Toshiba Corp | 携帯端末 |
CN102708858A (zh) * | 2012-06-27 | 2012-10-03 | 厦门思德电子科技有限公司 | 基于编组方式的语音库实现语音识别系统及其方法 |
CN103235643A (zh) * | 2013-04-09 | 2013-08-07 | 青岛旲天下智能科技有限公司 | 采用声控式的人机交互设备 |
CN103533415B (zh) * | 2013-10-12 | 2016-09-14 | 青岛旲天下智能科技有限公司 | 基于声控式人机交互技术的互联网电视系统及其实现方法 |
CN103885783A (zh) * | 2014-04-03 | 2014-06-25 | 深圳市三脚蛙科技有限公司 | 一种应用程序的语音控制方法及装置 |
-
2016
- 2016-07-26 CN CN201610589347.3A patent/CN106251863B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106251863A (zh) | 2016-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106251863B (zh) | 一种基于智能设备的指令式语音控制系统及控制方法 | |
KR102445927B1 (ko) | 질의 응답을 위한 디스플레이 장치 및 방법 | |
US20200311167A1 (en) | Method of and system for inferring user intent in search input in a conversational interaction system | |
US20160328205A1 (en) | Method and Apparatus for Voice Operation of Mobile Applications Having Unnamed View Elements | |
CN108829235A (zh) | 语音数据处理方法和支持该方法的电子设备 | |
AU2013270485C1 (en) | Input processing method and apparatus | |
JP6450768B2 (ja) | オンスクリーンキーボード用クイックタスク | |
TWI510965B (zh) | 輸入方法編輯器整合 | |
US20210407494A1 (en) | Control method and control apparatus for speech interaction | |
EP2891041B1 (en) | User interface apparatus in a user terminal and method for supporting the same | |
US20160139877A1 (en) | Voice-controlled display device and method of voice control of display device | |
CN104240700A (zh) | 一种面向车载终端设备的全局语音交互方法及系统 | |
CN106504748A (zh) | 一种语音控制方法和装置 | |
KR102630662B1 (ko) | 어플리케이션 실행 방법 및 이를 지원하는 전자 장치 | |
CN110462647A (zh) | 电子设备及执行电子设备的功能的方法 | |
CN110968245B (zh) | 一种透过语音控制office办公软件的操作方法 | |
CN106649253A (zh) | 基于后验证的辅助控制方法及系统 | |
CN103631784B (zh) | 页面内容检索方法和系统 | |
US20140351232A1 (en) | Accessing enterprise data using a natural language-based search | |
CN101604233B (zh) | 一种用于交互控制的语音虚拟键盘的使用方法 | |
Rosenfeld et al. | Universal Human-Machine Speech Interface | |
KR20090041929A (ko) | 사용자 기기의 오조작 패턴 분석을 통한 매뉴얼 제공 방법및 시스템 | |
US20180137178A1 (en) | Accessing data and performing a data processing command on the data with a single user input | |
CN110010131A (zh) | 一种语音信息处理的方法和装置 | |
CN115877997B (zh) | 一种面向交互元素的语音交互方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |