CN110928519A - 指令生成方法、智能键盘和存储介质 - Google Patents
指令生成方法、智能键盘和存储介质 Download PDFInfo
- Publication number
- CN110928519A CN110928519A CN201911424227.8A CN201911424227A CN110928519A CN 110928519 A CN110928519 A CN 110928519A CN 201911424227 A CN201911424227 A CN 201911424227A CN 110928519 A CN110928519 A CN 110928519A
- Authority
- CN
- China
- Prior art keywords
- voice
- instruction
- information
- keyboard
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012545 processing Methods 0.000 claims description 23
- 238000009432 framing Methods 0.000 claims description 20
- 230000001960 triggered effect Effects 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000003825 pressing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种指令生成方法,所述方法应用于智能键盘设备。该方法包括:获取用户的语音信息;根据所述语音信息获取对应的键盘指令;将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。本发明还公开了一种智能键盘及计算机可读存储介质。本发明能够通过对键盘的语音操作生成控制终端的键盘指令,并发送给终端执行对应的键盘指令,以简单方便的实现对终端的控制。
Description
技术领域
本发明涉及键盘技术领域,尤其涉及一种指令生成方法、智能键盘和计算机可读存储介质。
背景技术
目前,随着科技的发展,人工智能已越来越走进大众的视野,并在生活中加以应用。如智能电视,智能空调等,都已配备语音交互功能,这些设备都能够与人进行语音互动,根据用户的语音进行相关的操作,从而提高用户的使用体验。
但目前,在数据输入领域,人们还是习惯于使用机械键盘,进行数据的输入。采用机械的输入方式,不仅是较低的数据输入速度,还需要耗费较多的人力劳动,具有较多弊端。
发明内容
本发明的主要目的在于提供一种指令生成方法、智能键盘和计算机可读存储介质,旨在实现键盘的语音操作控制。
为实现上述目的,本发明提供一种指令生成方法,所述指令生成方法包括以下步骤:
获取用户的语音信息;
根据所述语音信息获取对应的键盘指令;
将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。
可选地,所述根据所述语音信息获取对应的键盘指令的步骤包括:
根据所述语音信息确定所述语音信息对应的文字信息;
对所述文字信息进行特征提取,获得关键词信息;
根据所述关键词信息确定对应的键盘指令。
可选地,所述对所述文字信息进行特征提取,获得关键词信息的步骤包括:
对所述文字信息进行语句分割,获得所述文字信息中的词语信息;
将所述词语信息与数据库中的预设关键词词条进行匹配,获得关键词信息。
可选地,所述根据所述关键词信息确定对应的键盘指令的步骤包括:
根据预设的键盘指令与关键词的对应关系对所述关键词信息进行匹配,获得对应的键盘指令。
可选地,所述根据所述语音信息确定所述语音信息对应的文字信息的步骤包括:
对所述语音信息进行转换,获得波形文件;
对所述波形文件进行分帧处理,获得多个语音帧;
对所述多个语音帧进行音频特征提取,获得观察序列;
通过观察序列对所述多个语音帧进行音素合成,获得文字信息。
可选地,所述对所述波形文件进行分帧处理,获得多个语音帧的步骤之前还包括:
对所述波形文件进行首尾静音切除,获得处理后的波形文件;
步骤对所述波形文件进行分帧处理,获得多个语音帧替换为:
对所述处理后的波形文件进行分帧处理,获得多个语音帧。
可选地,所述获取用户的语音信息的步骤包括:
检测键盘语音输入按钮的按键状态;
若所述键盘语音输入按钮的按键状态为被按压,则接收所述按键触发的语音操作指令,响应所述语音操作指令,并获取用户的语音信息。
可选地,所述获取用户的语音信息的步骤包括:
检测用户是否发出唤醒关键语句;
若检测到唤醒关键语句,则接收所述唤醒关键语句触发的语音操作指令,并响应所述语音操作指令,并获取用户的语音信息。
此外,为实现上述目的,本发明还提供一种智能键盘,所述智能键盘包括:存储器、处理器、麦克风及存储在所述存储器上并可在所述处理器上运行的指令生成程序,所述指令生成程序被所述处理器执行时实现如上所述的指令生成方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令生成程序,所述指令生成程序被处理器执行时实现上述的指令生成方法的步骤。
本发明提供一种指令生成方法、智能键盘和计算机存储介质。在该方法中,获取用户的语音信息;根据所述语音信息获取对应的键盘指令;将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。通过上述方式,本发明能够将用户的语音信息通过语音转换和文字识别在键盘中转化为键盘指令发送给电脑进行对应的操作处理,使得不精通键盘相关知识的用户不需进行相关的按键,就能通过语音实现键盘的快速操作,使键盘的使用更加方便,同时使用户可以通过多种方式进行输入。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明指令生成方法第一实施例的流程示意图;
图3为本发明指令生成方法第二实施例的流程示意图;
图4为本发明指令生成方法第三实施例的流程示意图;
图5为本发明指令生成方法第四实施例的流程示意图;
图6为本发明指令生成方法第五实施例的流程示意图;
图7为本发明指令生成方法第六实施例的流程示意图;
图8为本发明指令生成方法第七实施例的流程示意图;
图9为本发明指令生成方法第八实施例的流程示意图;
图10为本发明指令生成方法第五实施例的波形文件示意图;
图11为本发明指令生成方法第五实施例的波形文件重叠示意图;
图12为本发明指令生成方法第五实施例的语音帧提取特征示意图;
图13为本发明指令生成方法第二实施例的语音操作按钮示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。
本发明实施例终端可以是智能键盘,也可以是智能手机、平板电脑、便携计算机等具有数据处理功能的终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,麦克风1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。麦克风1003可以收集用户的语音信息。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在移动终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及指令生成程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;麦克风1003主要用于收集语音信息,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的指令生成程序,并执行以下操作:
获取用户的语音信息;
根据所述语音信息获取对应的键盘指令;
将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述根据所述语音信息获取对应的键盘指令的步骤包括:
根据所述语音信息确定所述语音信息对应的文字信息;
对所述文字信息进行特征提取,获得关键词信息;
根据所述关键词信息确定对应的键盘指令。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述对所述文字信息进行特征提取,获得关键词信息的步骤包括:
对所述文字信息进行语句分割,获得所述文字信息中的词语信息;
将所述词语信息与数据库中的预设关键词词条进行匹配,获得关键词信息。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述根据所述关键词信息确定对应的键盘指令的步骤包括:
根据预设的键盘指令与关键词的对应关系对所述关键词信息进行匹配,获得对应的键盘指令。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述根据所述语音信息确定所述语音信息对应的文字信息的步骤包括:
对所述语音信息进行转换,获得波形文件;
对所述波形文件进行分帧处理,获得多个语音帧;
对所述多个语音帧进行音频特征提取,获得观察序列;
通过观察序列对所述多个语音帧进行音素合成,获得文字信息。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述对所述波形文件进行分帧处理,获得多个语音帧的步骤之前还包括:
对所述波形文件进行首尾静音切除,获得处理后的波形文件;
步骤对所述波形文件进行分帧处理,获得多个语音帧替换为:
对所述处理后的波形文件进行分帧处理,获得多个语音帧。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述获取用户的语音信息的步骤包括:
检测键盘语音输入按钮的按键状态;
若所述键盘语音输入按钮的按键状态为被按压,则接收所述按键触发的语音操作指令,响应所述语音操作指令,并获取用户的语音信息。
进一步地,处理器1001可以调用存储器1005中存储的指令生成程序,还执行以下操作:
所述获取用户的语音信息的步骤包括:
检测用户是否发出唤醒关键语句;
若检测到唤醒关键语句,则接收所述唤醒关键语句触发的语音操作指令,并响应所述语音操作指令,并获取用户的语音信息。
本发明智能键盘的具体实施例与下述指令生成方法各实施例基本相同,在此不作赘述。
参照图2,图2为本发明指令生成方法第一实施例的流程示意图,所述指令生成方法包括:
步骤S100,获取用户的语音信息;
本实施方法可以应用于语音键盘,也可以应用于其他类似设备上,如其他输入设备。本实施方法能简化用户的输入操作,且无需在电脑上安装其他应用软件或进行其他配置。本实施方法可以应用于linux系统,还可以应用于其他系统。本实施例中的语音信息可以通过语音操作指令触发获得,也可以通过其他方式获得,语音操作指令可以通过语音操作按钮进行按键触发,也可以通过对应的唤醒关键语句进行唤醒触发。
步骤S200,根据所述语音信息获取对应的键盘指令;
在获取用户的语音信息后,可以通过对所述语音信息进行语音识别和计算匹配,获得对应的键盘操作指令。具体地,可以先通过语音转换算法对语音信息进行识别,获得对应的文字信息。在通过对文字信息进行识别匹配,获得文字信息对应的键盘指令。
步骤S300,将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。
在识别获得操作指令后,可以将键盘指令发送给电脑,以使得所述电脑进行对应的操作处理。本发明方法能使老人,小朋友和不精通计算机的人士更方便的使用语音键盘,进行键盘操作。进一步地,获得键盘指令后,可以通过预置的指令模拟软件将键盘指令发送给电脑,以使得所述电脑进行对应的操作。该预置的指令模拟软件可以为模拟SUB键盘软件模块,也可以为其他软件模块,该软件模块与电脑通信连接,给电脑发送相关指令。具体地,该指令模拟软件可以通过USB接口与电脑通信连接,也可以通过蓝牙等其他方式与电脑通信连接,还可以通过其他方式与电脑通信连接。该指令模拟软件可以支持windows系统和linux系统,还可以支持其他系统。例如,该指令模拟软件得到CTRL+C指令后,指令模拟软件将CTRL+C指令发送给电脑,以使得所述电脑进行对应的操作。
例如,用户在键盘上对语音操作按钮进行按键,同时对键盘说“复制”后松开按键,相应地,键盘进行用户语音信息的录音,并对录音进行语音转换,获得“复制”文字信息,然后与预设数据库进行比对,识别出用户的语音命令对应的快捷键盘操作为“ctrl+c”,并发送“ctrl+c”给电脑,让电脑执行复制操作。
本发明提供一种指令生成方法、智能键盘和计算机存储介质。在该方法中,获取用户的语音信息;根据所述语音信息获取对应的键盘指令;将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。通过上述方式,本发明能够将用户的语音信息通过语音转换和文字识别在键盘中转化为键盘指令发送给电脑进行对应的操作处理,使得不精通键盘相关知识的用户不需进行相关的按键,就能通过语音实现键盘的快速操作,使键盘的使用更加方便,同时使用户可以通过多种方式进行输入。
请参阅图3,图3为本发明指令生成方法第二实施例的流程示意图。
基于上述实施例,本实施例中,步骤S200包括:
步骤S210,根据所述语音信息确定所述语音信息对应的文字信息;
在获取用户的语音信息后,可以通过语音转换算法对语音信息进行识别,获得对应的文字信息。需要说明的是,该语音转换算法可以支持识别多种语言。具体地,该语音转换算法包括如下过程:语音转换成波形文件,分帧处理操作,提取特征操作,音素合成操作等,最后合成文字信息,完成将语音信息转换为文字信息。
步骤S220,对所述文字信息进行特征提取,获得关键词信息;
在获得文字信息后,可以对文字信息进行特征提取,获得关键词信息,具体地,可以采用模糊匹配的方式进行特征提取。模糊匹配是指,在匹配的过程中,自动忽略掉不能识别的文字,提取出能够识别的文字。例如,用户说“请复制这一行”,通过模糊匹配忽略掉不能识别的文字,提取能够识别的文字如“复制、一行”最后得到关键词“复制、一行”。通过模糊匹配的方式能够提高文字识别过程中的准确率。
步骤S230,根据所述关键词信息确定对应的键盘指令。
在获得文字信息后,对文字信息通过预设的指令数据可以进行识别,获得对应的键盘指令。如用户说“复制”,语音键盘通过语音转换和文字识别为电脑的快捷操作指令“ctrl+c”。进一步地,本申请中的指令数据库中的键盘指令可以为键盘上自带的默认键盘指令,也可以为用户通过设置特殊的键盘指令,还可以为其他键盘指令,本申请不作限定。
请参阅图4,图4为本发明指令生成方法第三实施例的流程示意图。
基于上述实施例,本实施例中,步骤S220包括:
步骤S221,对所述文字信息进行语句分割,获得所述文字信息中的词语信息;
在本实施例中,对所述文字信息进行特征提取,获得关键词信息。首先,先对所述文字信息进行语句分割,获得所述文字信息中的词语信息。具体地,该语句分割可以为根据文字信息的语句按照词性进行分割,分割为多个词语,如按照名词,动词,形容词等词性将语句分割为多个词语,词语信息。当然,也可以通过提取的方式,如提取语句中的名词和动词,忽悠掉其他词性的词语,获得词语信息。对文字信息进行语句分割为现有技术,在本领域中,有很多技术手段可以实现,本实施例中就不在赘述。
步骤S222,将所述词语信息与数据库中的预设关键词词条进行匹配,获得关键词信息。
在获得词语信息后,可以将述词语信息与数据库中的预设关键词词条进行匹配,获得关键词信息。具体地,数据库中会预设有多个关键词词条。如复制、粘贴、转行等,通过将分割后的词语信息与数据库中的预设关键词词条进行一一匹配的方式,获得关键词。如词语信息“复制”可以通过一一匹配的方式,获得关键词信息“复制”。
请参阅图5,图5为本发明指令生成方法第四实施例的流程示意图。
基于上述实施例,本实施例中,步骤S230包括:
步骤S231,根据预设的键盘指令与关键词的对应关系对所述关键词信息进行匹配,获得对应的键盘指令。
在获得关键词信息后,将关键词信息与预设数据库中的信息进行匹配,获得对应的键盘指令。预设数据库中,预先存储有关键词与键盘指令的对应关系。如“复制”对应“ctrl+c”。通过关键词与数据库中键盘指令与关键词的对应关系,可以通过关键词获得对应的键盘指令。
请参阅图6,图6为本发明指令生成方法第五实施例的流程示意图。
基于上述实施例,本实施例中,步骤S210包括:
步骤S211,对所述语音信息进行转换,获得波形文件;
在本实施例中,当用户按下录音键后,智能语音键盘上的mic开始进行录音,当用户松开按键时mic停止录音,先把录取到的语音转换成纯波形文件。具体波形文件示意图见图10。
步骤S212,对所述波形文件进行分帧处理,获得多个语音帧;
在获得波形文件后,对波形文件进行分帧处理,可以设定为每25ms为一帧,相邻两帧之间有15ms的重叠。具体如图11。
步骤S213,对所述多个语音帧进行音频特征提取,获得观察序列;
通过分帧处理,波形文件被分为多个语音帧,在多个语音帧中进行特征提取,获得观察序列。具体地,所述音频特征提取可以为MFCC特征提取。MFCC(Mel-FrequencyCepstral Coefficients)特征提取主要包括两个步骤转化到梅尔频率,然后进行倒谱分析。通过上述两个步骤最后获得观察序列。
步骤S214,通过观察序列对所述多个语音帧进行音素合成,获得文字信息。
在获得观察序列后,通过观察序列对所述多个语音帧进行音素合成,获得文字信息。具体地,先通过观察序列得到每帧音频数据的语音状态;再把每帧音频数据的语音状态组合成音素,再将音素合成文字信息,最后得到文字信息。具体地,参见图12,图12中的每个小竖条代表一帧,若干帧语音对应一个状态,每三个状态组合成一个音素,若干个音素组合成一个字。以此类推把整段原因转成文字,从而实现了对语音信息的转换,转换为文字信息。
请参阅图7,图7为本发明指令生成方法第六实施例的流程示意图。
基于上述实施例,本实施例中,步骤S212之前还包括:
步骤S215,对所述波形文件进行首尾静音切除,获得处理后的波形文件;
在本实施例中,在对所述波形文件进行分帧处理,获得多个语音帧之前,还可以先对所述波形文件进行首尾静音切除,获得处理后的波形文件。得到声音数据后,在开始语音识别前把首尾两端的静音部分切除,可以降低对后续进行语音识别的干扰。
此时,步骤S212则替换为:
步骤S216,对所述处理后的波形文件进行分帧处理,获得多个语音帧。
在进行首尾静音切除后,在对所述波形文件进行分帧处理,获得多个语音帧变为对所述处理后的波形文件进行分帧处理,获得多个语音帧。
请参阅图8,图8为本发明指令生成方法第七实施例的流程示意图。
基于上述实施例,本实施例中,步骤S100包括:
步骤S110,检测键盘语音输入按钮的按键状态;
若所述键盘语音输入按钮的按键状态为被按压,则执行步骤120:接收所述按键触发的语音操作指令,响应所述语音操作指令,并获取用户的语音信息。
在本实施例中,语音操作指令可以通过语音操作按钮进行按键触发。具体地,通过检测键盘语音输入按钮的按键状态,若用户进行了键盘语音操作按钮的按键,即通过键盘语音操作按钮触发了语音操作指令,则接收所述按键触发的语音操作指令,开始进行用户的语音信息录音。当然,若用户再次对语音操作按钮进行按键,则结束录音。或者再用户进行键盘语音操作按钮的按键过程中进行录音,在用户松开后,结束录音。具体地,语音操作按钮可以如图13所示,其中,键盘所有操作按钮中的最右上角的按钮设定为语音操作按钮。
请参阅图9,图9为本发明指令生成方法第八实施例的流程示意图。
基于上述实施例,本实施例中,步骤S100包括:
步骤S130,检测用户是否发出唤醒关键语句;
若检测到唤醒关键语句,则执行步骤140:接收所述唤醒关键语句触发的语音操作指令,并响应所述语音操作指令,并获取用户的语音信息。
在本实施例中,语音操作指令可以通过对应的唤醒关键语句进行唤醒触发。具体地,通过检测用户是否发出唤醒关键语句,若用户发出了唤醒关键语句,即关键语句触发了语音操作指令,则接收所述唤醒关键语句触发的语音输入指令。具体地,该唤醒关键语句可以为系统预设设定的,也可以为用户进行设置的,也可以为其他方式确定的。
此外,本发明实施例还提出一种计算机可读存储介质。
本发明计算机可读存储介质上存储有指令生成程序,所述指令生成程序被处理器执行时实现如上所述的指令生成方法的步骤。
其中,在所述处理器上运行的指令生成程序被执行时所实现的方法可参照本发明指令生成方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种指令生成方法,其特征在于,所述方法应用于智能键盘设备,所述方法包括以下步骤:
获取用户的语音信息;
根据所述语音信息获取对应的键盘指令;
将所述键盘指令发送给终端,以便所述终端执行所述键盘指令。
2.如权利要求1所述的指令生成方法,其特征在于,所述根据所述语音信息获取对应的键盘指令的步骤包括:
根据所述语音信息确定所述语音信息对应的文字信息;
对所述文字信息进行特征提取,获得关键词信息;
根据所述关键词信息确定对应的键盘指令。
3.如权利要求2所述的指令生成方法,其特征在于,所述对所述文字信息进行特征提取,获得关键词信息的步骤包括:
对所述文字信息进行语句分割,获得所述文字信息中的词语信息;
将所述词语信息与数据库中的预设关键词词条进行匹配,获得关键词信息。
4.如权利要求2所述的指令生成方法,其特征在于,所述根据所述关键词信息确定对应的键盘指令的步骤包括:
根据预设的键盘指令与关键词的对应关系对所述关键词信息进行匹配,获得对应的键盘指令。
5.如权利要求2所述的指令生成方法,其特征在于,所述根据所述语音信息确定所述语音信息对应的文字信息的步骤包括:
对所述语音信息进行转换,获得波形文件;
对所述波形文件进行分帧处理,获得多个语音帧;
对所述多个语音帧进行音频特征提取,获得观察序列;
通过观察序列对所述多个语音帧进行音素合成,获得文字信息。
6.如权利要求5所述的指令生成方法,其特征在于,所述对所述波形文件进行分帧处理,获得多个语音帧的步骤之前还包括:
对所述波形文件进行首尾静音切除,获得处理后的波形文件;
步骤对所述波形文件进行分帧处理,获得多个语音帧替换为:
对所述处理后的波形文件进行分帧处理,获得多个语音帧。
7.如权利要求1所述的指令生成方法,其特征在于,所述获取用户的语音信息的步骤包括:
检测键盘语音输入按钮的按键状态;
若所述键盘语音输入按钮的按键状态为被按压,则接收所述按键触发的语音操作指令,响应所述语音操作指令,并获取用户的语音信息。
8.如权利要求1所述的指令生成方法,其特征在于,所述获取用户的语音信息的步骤包括:
检测用户是否发出唤醒关键语句;
若检测到唤醒关键语句,则接收所述唤醒关键语句触发的语音操作指令,并响应所述语音操作指令,并获取用户的语音信息。
9.一种智能键盘,其特征在于,所述智能键盘包括:存储器、处理器、麦克风及存储在所述存储器上并可在所述处理器上运行的指令生成程序,所述指令生成程序被所述处理器执行时实现如权利要求1至8中任一项所述指令生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令生成程序,所述指令生成程序被处理器执行时实现如权利要求1至8中任一项所述指令生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424227.8A CN110928519A (zh) | 2019-12-30 | 2019-12-30 | 指令生成方法、智能键盘和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424227.8A CN110928519A (zh) | 2019-12-30 | 2019-12-30 | 指令生成方法、智能键盘和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110928519A true CN110928519A (zh) | 2020-03-27 |
Family
ID=69854204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911424227.8A Pending CN110928519A (zh) | 2019-12-30 | 2019-12-30 | 指令生成方法、智能键盘和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110928519A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186232A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音键盘装置 |
US20130300666A1 (en) * | 2012-05-11 | 2013-11-14 | Verizon Patent And Licensing Inc. | Voice keyboard |
CN104750257A (zh) * | 2013-12-30 | 2015-07-01 | 鸿富锦精密工业(武汉)有限公司 | 键盘组合及语音识别方法 |
CN107632720A (zh) * | 2017-03-08 | 2018-01-26 | 深圳市中易腾达科技股份有限公司 | 一种多功能语音键盘及应用系统 |
CN108305626A (zh) * | 2018-01-31 | 2018-07-20 | 百度在线网络技术(北京)有限公司 | 应用程序的语音控制方法和装置 |
CN108320747A (zh) * | 2018-02-08 | 2018-07-24 | 广东美的厨房电器制造有限公司 | 家电设备控制方法、设备、终端及计算机可读存储介质 |
CN110277088A (zh) * | 2019-05-29 | 2019-09-24 | 平安科技(深圳)有限公司 | 智能语音识别方法、装置及计算机可读存储介质 |
-
2019
- 2019-12-30 CN CN201911424227.8A patent/CN110928519A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186232A (zh) * | 2011-12-30 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 语音键盘装置 |
US20130300666A1 (en) * | 2012-05-11 | 2013-11-14 | Verizon Patent And Licensing Inc. | Voice keyboard |
CN104750257A (zh) * | 2013-12-30 | 2015-07-01 | 鸿富锦精密工业(武汉)有限公司 | 键盘组合及语音识别方法 |
CN107632720A (zh) * | 2017-03-08 | 2018-01-26 | 深圳市中易腾达科技股份有限公司 | 一种多功能语音键盘及应用系统 |
CN108305626A (zh) * | 2018-01-31 | 2018-07-20 | 百度在线网络技术(北京)有限公司 | 应用程序的语音控制方法和装置 |
CN108320747A (zh) * | 2018-02-08 | 2018-07-24 | 广东美的厨房电器制造有限公司 | 家电设备控制方法、设备、终端及计算机可读存储介质 |
CN110277088A (zh) * | 2019-05-29 | 2019-09-24 | 平安科技(深圳)有限公司 | 智能语音识别方法、装置及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829235B (zh) | 语音数据处理方法和支持该方法的电子设备 | |
CN110379430B (zh) | 基于语音的动画显示方法、装置、计算机设备及存储介质 | |
US10811005B2 (en) | Adapting voice input processing based on voice input characteristics | |
US11455989B2 (en) | Electronic apparatus for processing user utterance and controlling method thereof | |
CN111045639B (zh) | 语音输入方法、装置、电子设备及存储介质 | |
CN113327609B (zh) | 用于语音识别的方法和装置 | |
CN110164421B (zh) | 语音解码方法、装置及存储介质 | |
EP3790001B1 (en) | Speech information processing method, device and storage medium | |
CN107155121B (zh) | 语音控制文本的显示方法及装置 | |
US20210110815A1 (en) | Method and apparatus for determining semantic meaning of pronoun | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
US20210233522A1 (en) | Voice context-aware content manipulation | |
JP2019175453A (ja) | ユーザ音声入力の処理を含むシステム及びその動作方法並びに電子装置 | |
KR20190068133A (ko) | 오디오 데이터에 포함된 음소 정보를 이용하여 어플리케이션을 실행하기 위한 전자 장치 및 그의 동작 방법 | |
CN111640434A (zh) | 用于控制语音设备的方法和装置 | |
EP3550449A1 (en) | Search method and electronic device using the method | |
CN111435595A (zh) | 文本规整方法及装置 | |
CN113220590A (zh) | 语音交互应用的自动化测试方法、装置、设备及介质 | |
CN106980640B (zh) | 针对照片的交互方法、设备和计算机可读存储介质 | |
CN116860913A (zh) | 语音交互方法、装置、设备及存储介质 | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
CN116229962A (zh) | 终端设备及语音唤醒方法 | |
CN110928519A (zh) | 指令生成方法、智能键盘和存储介质 | |
CN114999496A (zh) | 音频传输方法、控制设备及终端设备 | |
CN111667829B (zh) | 信息处理方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200327 |