CN110136702B - 语音识别系统及其方法 - Google Patents
语音识别系统及其方法 Download PDFInfo
- Publication number
- CN110136702B CN110136702B CN201810330094.7A CN201810330094A CN110136702B CN 110136702 B CN110136702 B CN 110136702B CN 201810330094 A CN201810330094 A CN 201810330094A CN 110136702 B CN110136702 B CN 110136702B
- Authority
- CN
- China
- Prior art keywords
- electronic device
- instruction
- software
- parameter
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013515 script Methods 0.000 claims abstract description 86
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 241000238558 Eucarida Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本发明提供一种语音识别系统及其方法。所述系统包括头戴式装置以及电子装置。电子装置具有语音助理以及语音识别软件。语音助理根据第一语音信号取得第一指令。语音识别软件根据电子装置目前所执行的第一应用程序,从多个脚本中取得对应于第一应用程序的第一脚本。语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。第一应用程序根据第一参数执行对应于第一指令的第一操作。头戴式装置以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。
Description
技术领域
本发明涉及一种语音识别系统及其方法。
背景技术
当使用者在使用头戴式装置(例如,虚拟实境的头盔)时,由于使用者无法看到键盘及鼠标,即使有配套的遥控器,但该遥控器能够输入的指令仍然有限。此外,近年来语音助理技术(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)的发展已渐趋完整,而如何将语音助理技术应用在虚拟实境的内容中,仍是本领域技术人员所欲解决的问题之一。
发明内容
本发明提供一种语音识别系统与语音识别方法,可以让使用者在戴着头戴式装置时,使用者直接发出声音下达指令以使得电子装置识别并执行包含参数的复杂指令。
本发明提出一种语音识别系统。此系统包括头戴式装置以及电子装置。电子装置具有语音助理以及语音识别软件。语音助理根据第一语音信号取得第一指令。语音识别软件根据电子装置目前所执行的第一应用程序,从多个脚本中取得对应于第一应用程序的第一脚本。语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。第一应用程序根据第一参数执行对应于第一指令的第一操作。头戴式装置以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。
在本发明的一实施例中,其中在语音助理根据第一语音信号取得第一指令的运作之前,语音助理根据第二语音信号取得第二指令。电子装置根据第二指令启动语音识别软件。
在本发明的一实施例中,其中电子装置包括第一电子装置以及第二电子装置。语音识别软件包括第一软件以及第二软件。其中,第一电子装置用以执行第一软件以及语音助理,第二电子装置用以执行第二软件以及第一应用程序。
在本发明的一实施例中,其中在语音识别软件根据电子装置目前所执行的第一应用程序,从所述脚本中取得对应于第一应用程序的第一脚本的运作中,第一电子装置执行第一软件以根据第二电子装置目前所执行的第一应用程序,从所述脚本中取得对应于第一应用程序的第一脚本。
在本发明的一实施例中,其中在语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数的运作中,第一电子装置执行第一软件以通过第一软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。
在本发明的一实施例中,其中在第一应用程序根据第一参数执行对应于第一指令的第一操作的运作中,第二电子装置所执行的第二软件从第一电子装置接收识别结果,此识别结果包括对应第一指令的第一操作以及第一指令中的第一参数。第二电子装置所执行的第一应用程序根据第一参数执行对应于第一指令的第一操作。
在本发明的一实施例中,其中所述脚本存储于电子装置或云端数据库中。
本发明提出一种语音识别方法,用于语音识别系统。此语音识别系统包括头戴式装置以及电子装置,其中电子装置具有语音助理以及语音识别软件,所述方法包括:通过语音助理根据第一语音信号取得第一指令;通过语音识别软件根据电子装置目前所执行的第一应用程序,从多个脚本中取得对应于第一应用程序的第一脚本;通过语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数;通过第一应用程序根据第一参数执行对应于第一指令的第一操作;以及通过头戴式装置以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。
在本发明的一实施例中,其中在通过语音助理根据第一语音信号取得第一指令的运作之前,所述方法还包括:通过语音助理根据第二语音信号取得第二指令;以及通过电子装置根据第二指令启动语音识别软件。
在本发明的一实施例中,其中电子装置包括第一电子装置以及第二电子装置,语音识别软件包括第一软件以及第二软件,所述方法还包括:通过第一电子装置执行第一软件以及语音助理;以及通过第二电子装置执行第二软件以及第一应用程序。
在本发明的一实施例中,其中通过语音识别软件根据电子装置目前所执行的第一应用程序,从所述脚本中取得对应于第一应用程序的第一脚本的步骤包括:通过第一电子装置执行第一软件以根据第二电子装置目前所执行的第一应用程序,从所述脚本中取得对应于第一应用程序的第一脚本。
在本发明的一实施例中,其中通过语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数的步骤包括:通过第一电子装置执行第一软件以通过第一软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。
在本发明的一实施例中,其中通过第一应用程序根据第一参数执行对应于第一指令的第一操作的步骤包括:通过第二电子装置所执行的第二软件从第一电子装置接收识别结果,其中识别结果包括对应第一指令的第一操作以及第一指令中的第一参数;以及通过第二电子装置所执行的第一应用程序根据第一参数执行对应于第一指令的第一操作。
在本发明的一实施例中,其中所述脚本存储于电子装置或云端数据库中。
基于上述,本发明的语音识别系统可以让使用者在戴着头戴式装置时,使用者直接发出声音下达指令以使得电子装置识别并执行包含参数的复杂指令。此外,本发明的语音识别系统还可以将第一实施例中的语音识别软件分为第一软件与第二软件并分散存储在第一电子装置与第二电子装置中,并通过第一电子装置执行第一软件以识别使用者下达的指令,并通过第二电子装置执行第二软件以从第一电子装置的第一软件接收识别结果以让第二电子装置所执行的第一应用程序根据识别结果执行对应的操作。藉此,第二电子装置可以不需具备语音助理且当第一电子装置连结不同的第二电子装置时,可以达到不需要每次重新设定对应于应用程序的脚本的技术效果。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1是依照本发明的第一实施例所显示的语音识别系统的示意图;
图2A至图2B是依照本发明的第一实施例所显示的语音识别系统的运作的示意图;
图3是依照本发明的一实施例所显示的第一脚本的示意图;
图4是依照本发明的第一实施例所显示的语音识别方法的流程图;
图5是依照本发明的第二实施例所显示的语音识别系统的示意图;
图6是依照本发明的第二实施例所显示的语音识别系统的运作的示意图;
图7是依照本发明的第二实施例所显示的语音识别方法的流程图。
附图标号说明:
1000、2000:语音识别系统
100:头戴式装置
120:电子装置
120a:第一电子装置
120b:第二电子装置
30、40:处理单元
32:显示单元
34、42:通讯单元
36、44:存储单元
41:输入单元
50:语音助理
52:语音识别软件
300:第一脚本
60、62:栏位
S401:语音助理根据第一语音信号取得第一指令的步骤
S403:语音识别软件根据电子装置目前所执行的第一应用程序,从多个脚本中取得对应于第一应用程序的第一脚本的步骤
S405:语音识别软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数的步骤
S407:第一应用程序根据第一参数执行对应于第一指令的第一操作的步骤
S409:头戴式装置以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果的步骤
70:第一软件
72:第二软件
74:第一应用程序
S701:第一电子装置执行语音助理以根据第一语音信号取得第一指令的步骤
S703:第一电子装置执行第一软件以根据第二电子装置目前所执行的第一应用程序,从脚本中取得对应于第一应用程序的第一脚本的步骤
S705:第一电子装置执行第一软件以通过第一软件根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数的步骤
S707:第二电子装置所执行的第二软件从第一电子装置接收一识别结果,识别结果包括对应第一指令的第一操作以及第一指令中的第一参数的步骤
S709:第二电子装置所执行的第一应用程序根据第一参数执行对应于第一指令的第一操作的步骤
具体实施方式
现将详细参考本发明的示范性实施例,在附图中说明所述示范性实施例的实例。另外,凡可能之处,在附图及实施方式中使用相同标号的元件/构件代表相同或类似部分。
以下以多个实施例来描述本发明的语音识别系统的运作方式。
[第一实施例]
图1是依照本发明的第一实施例所显示的语音识别系统的示意图。
请参照图1,语音识别系统1000包括头戴式装置100与电子装置120。其中,头戴式装置100与电子装置120彼此之间可以进行有线或无线的传输。
在本范例实施例中,头戴式装置100可以包括处理单元30、显示单元32、通讯单元34以及存储单元36。其中,显示单元32、通讯单元34以及存储单元36分别耦接至处理单元30。头戴式装置100例如是用以显示虚拟实境的穿戴式显示装置(例如,头戴式显示装置),在此不设限。
处理单元30可以是中央处理单元(Central Processing Unit,CPU),或是其他可程序化的一般用途或特殊用途的微处理器(Microprocessor)、数字信号处理器(DigitalSignal Processor,DSP)、可程序化控制器、特殊应用集成电路(Application SpecificIntegrated Circuit,ASIC)或其他类似元件或上述元件的组合。
显示单元32可以在头戴式装置100的显示区域内提供显示功能的显示装置。显示单元32可为液晶显示器(liquid crystal display,LCD)、发光二极管(light-emittingdiode,LED)、场发射显示器(field emission display,FED)等提供显示功能的显示装置。
通讯单元34可为支援全球行动通信(global system for mobilecommunication,GSM)、个人手持式电话系统(personal handy-phone system,PHS)、码多重获取(code division multiple access,CDMA)系统、宽频码分多址(wideband codedivision multiple access,WCDMA)系统、长期演进(long term evolution,LTE)系统、全球互通微波存取(worldwide interoperability for microwave access,WiMAX)系统、无线保真(wireless fidelity,Wi-Fi)系统、蓝牙、无线千兆联盟(Wireless GigabitAlliance,WiGig)技术或其他有线的信号传输的元件。头戴式装置100可以通过通讯单元34来与电子装置120进行有线或无线的通讯。
存储单元36可以是任何形态的固定或可移动随机存取存储器(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、快闪存储器(flash memory)或类似元件或上述元件的组合。
在本范例实施例中,头戴式装置100的存储单元36中存储有多个程序码片段,在上述程序码片段被安装后,会由处理单元30来执行。例如,存储单元36中包括多个模块,通过这些模块来分别执行头戴式装置100应用于语音识别系统1000中的各个运作,其中各模块是由一或多个程序码片段所组成。然而本发明不限于此,头戴式装置100的各个运作也可以是使用其他硬件形式的方式来实现。
此外,本实施例的电子装置120包括处理单元40、输入单元41、通讯单元42以及存储单元44。其中,输入单元41、通讯单元42以及存储单元44分别耦接至处理单元40。处理单元40、通讯单元42以及存储单元44可以分别是与上述处理单元30、通讯单元34以及存储单元36相类似的元件,在此并不赘述。
输入单元41可以是用于取得语音信号(例如,声音)的装置或元件,例如麦克风。
在本范例实施例中,电子装置120的存储单元44中存储有多个程序码片段,在上述程序码片段被安装后,会由处理单元40来执行。例如,存储单元44中包括多个模块,通过这些模块来分别执行电子装置120应用于语音识别系统1000中的各个运作,其中各模块是由一或多个程序码片段所组成。然而本发明不限于此,电子装置120的各个运作也可以是使用其他硬件形式的方式来实现。
图2A至图2B是依照本发明的第一实施例所显示的语音识别系统的运作的示意图。
请参照图2A,在本范例实施例中,电子装置120会被安装语音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及语音识别软件52。当语音识别软件52尚未被启动时,穿戴头戴式装置100的使用者可以发出声音以下达指令。例如,穿戴头戴式装置100的使用者可以说出“launch voice command”。此时,语音助理50会通过输入单元41取得“launch voice command”的语音信号(在此称为,第二语音信号)。语音助理50会根据此第二语音信号识别并取得一指令(在此称为,第二指令),此第二指令(例如为“launch”)用于开启语音识别软件52。之后,电子装置120会根据上述的第二指令启动语音识别软件52。
此外,语音识别软件52还会根据电子装置120目前所执行的应用程序(在此称为,第一应用程序),从多个脚本中取得对应于第一应用程序的脚本(在此称为,第一脚本)。举例来说,图3是依照本发明的一实施例所显示的第一脚本的示意图。请参照图3,假设电子装置120目前所执行的第一应用程序为“Call of Duty 2.exe”,则语音识别软件52会取得对应于“Call of Duty 2.exe”的第一脚本300。其中,第一脚本300中例如包括使用者可以下达的指令以及指令所对应的操作。须注意的是,不同的应用程序可以对应到不同的脚本。此外,上述的脚本可以是存储于电子装置120或云端数据库(未显示)中。
举例来说,请同时参照图2B以及图3,当电子装置120已启动语音识别软件52且目前所执行的第一应用程序为“Call of Duty 2.exe”时,语音识别软件52可以取得对应于“Call of Duty 2.exe”的第一脚本300。当使用者说出“voice command“Jump””时,语音助理50会通过输入单元41取得“voice command“Jump””的语音信号(在此称为,第一语音信号)。语音助理50会根据此第一语音信号识别并取得一指令(在此称为,第一指令)。在本范例实施例中,第一指令为“Jump”。语音识别软件52会根据第一脚本300识别对应第一指令的操作(在此称为,第一操作)以及在第一指令中的参数(在此称为,第一参数)。如第一脚本300中的栏位60所示,当第一指令为“Jump”时,此时第一指令中不具有参数,而对应于此第一指令的第一操作为“Click space button”(即,按下空白键)。在识别出第一指令所对应的操作后,第一应用程序(即,名为“Call of Duty 2.exe”的程序)可以执行对应于第一指令的第一操作。换句话说,当第一指令为“Jump”时,第一应用程序可以执行按下空白键的功能。之后,头戴式装置100会以虚拟实境的方式显示执行对应于第一指令的第一操作的执行结果。
而在另一实施例中,当电子装置120已启动语音识别软件且目前所执行的第一应用程序为“Call of Duty 2.exe”时,语音识别软件52可以取得对应于“Call of Duty2.exe”的第一脚本300。而当使用者说出“Jump after 3seconds”时,语音助理50会通过输入单元41取得“Jump after 3seconds”的语音信号(在此称为,第一语音信号)。语音助理50会根据此第一语音信号识别并取得一指令(在此称为,第一指令)。在本范例实施例中,第一指令为“[command]after[number]seconds”。语音识别软件52会根据第一脚本300识别对应第一指令的操作(在此称为,第一操作)以及第一指令中的参数(在此称为,第一参数)。如第一脚本300中的栏位62所示,当第一指令为“[command]after[number]seconds”时,代表所述第一指令中具有第一参数。由于第一语音信号为“Jump after 3seconds”,故第一参数包括“Jump”与“3”。而对应于第一指令的第一操作为“Do[command]action after[number]seconds”。在识别出第一指令所对应的操作以及第一指令中的第一参数后,第一应用程序(即,名为“Call of Duty 2.exe”的程序)可以根据第一参数执行对应于第一指令的第一操作。换句话说,当第一语音信号为“Jump after 3seconds”时,第一应用程序可以执行在三秒之后按下空白键的功能。之后,头戴式装置100会以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。
图4是依照本发明的第一实施例所显示的语音识别方法的流程图。
请参照图4,在步骤S401中,语音助理50根据第一语音信号取得第一指令。在步骤S403中,语音识别软件52根据电子装置120目前所执行的第一应用程序,从多个脚本中取得对应于第一应用程序的第一脚本。在步骤S405中,语音识别软件52根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。在步骤S407中,第一应用程序根据第一参数执行对应于第一指令的第一操作。最后在步骤S409中,头戴式装置100以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。须注意的是,本发明也可以先执行步骤S403再执行步骤S401。
通过上述方式,针对电子装置120目前所执行的应用程序,语音识别软件52会自动搜寻出对应的脚本。而当使用者在戴着头戴式装置100时,可以直接发出声音下达指令以使得电子装置100执行包含参数的复杂指令。然而须注意的是,一般的语音识别系统并无法识别包含参数的复杂指令。
[第二实施例]
图5是依照本发明的第二实施例所显示的语音识别系统的示意图。
请参照图5,语音识别系统2000包括头戴式装置100与电子装置120。与第一实施例不同的是,第二实施例中的电子装置120包括第一电子装置120a与第二电子装置120b且在本发明的第二实施例中,前述的语音识别软件52包括第一软件与第二软件。第一电子装置120a用以执行第一软件以及语音助理50,而第二电子装置120b用以执行第二软件以及前述的第一应用程序(例如名为“Call of Duty 2.exe”的程序)。
此外,在第二实施例中,第一电子装置120a例如是行动装置(例如,手机)或者是穿戴式装置(例如,智能手表)。第二电子装置120b例如是台式电脑。然而,本发明并不用于限定第一电子装置120a与第二电子装置120b的装置种类。此外,第一电子装置120a与第二电子装置120b所需的元件可以如图1中电子装置120所显示的元件,在此并不再赘述。此外,第一电子装置120a与第二电子装置120b彼此之间可以进行有线或无线的通讯。
图6是依照本发明的第二实施例所显示的语音识别系统的运作的示意图。
请参照图6,在本范例实施例中,第一电子装置120a会被安装语音助理50(例如,iOS的Siri、Windows的Cortana或Android的GOOGLE NOW等)以及第一软件70。第二电子装置120b会被安装第二软件72以及第一应用程序74。
第一电子装置120a首先会执行第一软件70以根据第二电子装置120b目前所执行的第一应用程序74,从多个脚本中取得对应于第一应用程序的脚本(在此称为,第一脚本)。举例来说,请再次参照图3,假设第二电子装置120b目前所执行的第一应用程序为“Call ofDuty 2.exe”,则第一软件70会取得对应于“Call of Duty 2.exe”的第一脚本300。
请同时参照图6以及图3,当第二电子装置120b已启动第二软件72且目前所执行的第一应用程序74为“Call of Duty 2.exe”时,第一电子装置120a的第一软件70可以取得对应于“Call of Duty 2.exe”的第一脚本300。当使用者说出“voice command“Jump””时,第一电子装置120a的语音助理50会通过第一电子装置120a的输入单元取得“voice command“Jump””的语音信号(在此称为,第一语音信号)。语音助理50会根据此第一语音信号识别并取得一指令(在此称为,第一指令)。在本范例实施例中,第一指令为“Jump”。第一电子装置120a所执行的第一软件70会根据第一脚本300识别对应第一指令的操作(在此称为,第一操作)以及在第一指令中的参数(在此称为,第一参数)。如第一脚本300中的栏位60所示,当第一指令为“Jump”时,此时第一指令中不具有参数,而对应于此第一指令的第一操作为“Click space button”(即,按下空白键)。在识别出第一指令所对应的操作后,第二电子装置120b所执行的第二软件72会从第一电子装置120a接收一识别结果,此识别结果包括对应第一指令的第一操作以及第一指令中的第一参数。之后,第二软件72可以将识别结果中对应第一指令的第一操作以及第一指令中的第一参数传送给第一应用程序74,第一应用程序74可以执行对应于第一指令的第一操作。换句话说,当第一指令为“Jump”时,第一应用程序可以执行按下空白键的功能。之后,头戴式装置100会以虚拟实境的方式显示执行对应于第一指令的第一操作的执行结果。
而在另一实施例中,当第二电子装置120b已启动第二软件72且目前所执行的第一应用程序74为“Call of Duty 2.exe”时,第一电子装置120a的第一软件70可以取得对应于“Call of Duty 2.exe”的第一脚本300。而当使用者说出“Jump after 3seconds”时,第一电子装置120a的语音助理50会通过第一电子装置120a的输入单元取得“Jump after3seconds”的语音信号(在此称为,第一语音信号)。语音助理50会根据此第一语音信号识别并取得一指令(在此称为,第一指令)。在本范例实施例中,第一指令为“[command]after[number]seconds”。第一电子装置120a所执行的第一软件70会根据第一脚本300识别对应第一指令的操作(在此称为,第一操作)以及第一指令中的参数(在此称为,第一参数)。如第一脚本300中的栏位62所示,当第一指令为“[command]after[number]seconds”代表该第一指令中具有第一参数。由于第一语音信号为“Jump after 3seconds”,故第一参数包括“Jump”与“3”。而对应于第一指令的第一操作为“Do[command]action after[number]seconds”。在识别出第一指令所对应的操作以及第一指令中的第一参数后,第二电子装置120b所执行的第二软件72会从第一电子装置120a接收一识别结果,此识别结果包括对应第一指令的第一操作以及第一指令中的第一参数。之后,第二软件72可以将识别结果中对应第一指令的第一操作以及第一指令中的第一参数传送给第一应用程序74,第一应用程序74可以根据第一参数执行对应于第一指令的第一操作。换句话说,当第一语音信号为“Jumpafter3seconds”时,第一应用程序74可以执行在三秒之后按下空白键的功能。之后,头戴式装置100会以虚拟实境的方式显示根据第一参数执行对应于第一指令的第一操作的执行结果。
图7是依照本发明的第二实施例所显示的语音识别方法的流程图。
请参照图7,在步骤S701中,第一电子装置120a执行语音助理50以根据第一语音信号取得第一指令。在步骤S703中,第一电子装置120a执行第一软件70以根据第二电子装置120b目前所执行的第一应用程序74,从脚本中取得对应于第一应用程序74的第一脚本。在步骤S705中,第一电子装置120a执行第一软件70以通过第一软件70根据第一脚本识别对应第一指令的第一操作以及第一指令中的第一参数。在步骤S707中,第二电子装置120b所执行的第二软件72从第一电子装置120a接收一识别结果,此识别结果包括对应第一指令的第一操作以及第一指令中的第一参数。最后在步骤S709中,第二电子装置120b所执行的第一应用程序74根据第一参数执行对应于第一指令的第一操作。须注意的是,本发明也可以先执行步骤S703再执行步骤S701。
通过上述方式,在第二实施例中,当第一电子装置120a是行动式或穿戴式装置时,由于行动式或穿戴式装置的语音助理已相当成熟,故利用行动式或穿戴式装置的语音助理实现解析指令的动作,一来可以避免第二电子装置120b(例如,桌上型电脑)本身不具备语音助理的功能,二来用户所设定的脚本设定也可以不需绑定第二电子装置120b,通过此方式,当第一电子装置120a连结不同的第二电子装置120b时,可以达到不需要每次重新设定对应于应用程序的脚本的技术效果。
综上所述,在第一实施例中,本发明的语音识别系统可以让使用者在戴着头戴式装置时,使用者直接发出声音下达指令以使得电子装置识别并执行包含参数的复杂指令。此外,在第二实施例中,可以将第一实施例中的语音识别软件分为第一软件与第二软件并分散存储在第一电子装置与第二电子装置中,并通过第一电子装置执行第一软件以识别使用者下达的指令,并通过第二电子装置执行第二软件以从第一电子装置的第一软件接收识别结果以让第二电子装置所执行的第一应用程序根据识别结果执行对应的操作。藉此,第二电子装置可以不需具备语音助理且当第一电子装置连结不同的第二电子装置时,可以达到不需要每次重新设定对应于应用程序的脚本的技术效果。
虽然本发明已以实施例揭示如上,然其并非用以限定本发明,任何所属技术领域中技术人员,在不脱离本发明的精神和范围内,当可作些许的更改与润饰,故本发明的保护范围当视权利要求所界定的为准。
Claims (12)
1.一种语音识别系统,其特征在于,包括:
头戴式装置;以及
电子装置,具有语音助理以及语音识别软件,其中
所述语音助理根据第一语音信号取得第一指令,
所述语音识别软件根据所述电子装置目前所执行的第一应用程序,从多个脚本中取得对应于所述第一应用程序的第一脚本,
所述语音识别软件根据所述第一脚本识别对应所述第一指令的第一操作以及所述第一指令中的第一参数,
所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作,
所述头戴式装置以虚拟实境的方式显示根据所述第一参数执行对应于所述第一指令的所述第一操作的执行结果,以及
所述电子装置包括第一电子装置以及第二电子装置,所述语音识别软件包括第一软件以及第二软件,其中
所述第一电子装置用以执行所述第一软件以及所述语音助理,以及
所述第二电子装置用以执行所述第二软件以及所述第一应用程序。
2.根据权利要求1所述的语音识别系统,其特征在于,在所述语音助理根据所述第一语音信号取得所述第一指令的运作之前,
所述语音助理根据第二语音信号取得第二指令,以及
所述电子装置根据所述第二指令启动所述语音识别软件。
3.根据权利要求1所述的语音识别系统,其特征在于,在所述语音识别软件根据所述电子装置目前所执行的所述第一应用程序,从所述多个脚本中取得对应于所述第一应用程序的所述第一脚本的运作中,
所述第一电子装置执行所述第一软件以根据所述第二电子装置目前所执行的所述第一应用程序,从所述多个脚本中取得对应于所述第一应用程序的所述第一脚本。
4.根据权利要求3所述的语音识别系统,其特征在于,在所述语音识别软件根据所述第一脚本识别对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数的运作中,
所述第一电子装置执行所述第一软件以通过所述第一软件根据所述第一脚本识别对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数。
5.根据权利要求4所述的语音识别系统,其特征在于,在所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作的运作中,
所述第二电子装置所执行的所述第二软件从所述第一电子装置接收识别结果,所述识别结果包括对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数,以及
所述第二电子装置所执行的所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作。
6.根据权利要求1所述的语音识别系统,其特征在于,所述多个脚本存储于所述电子装置或云端数据库中。
7.一种语音识别方法,用于语音识别系统,所述语音识别系统包括头戴式装置以及电子装置,其中所述电子装置具有语音助理以及语音识别软件,其特征在于,所述方法包括:
通过所述语音助理根据第一语音信号取得第一指令;
通过所述语音识别软件根据所述电子装置目前所执行的第一应用程序,从多个脚本中取得对应于所述第一应用程序的第一脚本;
通过所述语音识别软件根据所述第一脚本识别对应所述第一指令的第一操作以及所述第一指令中的第一参数;
通过所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作;以及
通过所述头戴式装置以虚拟实境的方式显示根据所述第一参数执行对应于所述第一指令的所述第一操作的一执行结果,其中所述电子装置包括第一电子装置以及第二电子装置,所述语音识别软件包括第一软件以及第二软件,所述方法还包括:
通过所述第一电子装置执行所述第一软件以及所述语音助理;以及
通过所述第二电子装置执行所述第二软件以及所述第一应用程序。
8.根据权利要求7所述的语音识别方法,其特征在于,在通过所述语音助理根据所述第一语音信号取得所述第一指令的运作之前,所述方法还包括:
通过所述语音助理根据第二语音信号取得第二指令;以及
通过所述电子装置根据所述第二指令启动所述语音识别软件。
9.根据权利要求7所述的语音识别方法,其特征在于,通过所述语音识别软件根据所述电子装置目前所执行的所述第一应用程序,从所述多个脚本中取得对应于所述第一应用程序的所述第一脚本的步骤包括:
通过所述第一电子装置执行所述第一软件以根据所述第二电子装置目前所执行的所述第一应用程序,从所述多个脚本中取得对应于所述第一应用程序的所述第一脚本。
10.根据权利要求9所述的语音识别方法,其特征在于,通过所述语音识别软件根据所述第一脚本识别对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数的步骤包括:
通过所述第一电子装置执行所述第一软件以通过所述第一软件根据所述第一脚本识别对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数。
11.根据权利要求10所述的语音识别方法,其特征在于,通过所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作的步骤包括:
通过所述第二电子装置所执行的所述第二软件从所述第一电子装置接收识别结果,其中所述识别结果包括对应所述第一指令的所述第一操作以及所述第一指令中的所述第一参数;以及
通过所述第二电子装置所执行的所述第一应用程序根据所述第一参数执行对应于所述第一指令的所述第一操作。
12.根据权利要求7所述的语音识别方法,其特征在于,所述多个脚本存储于所述电子装置或云端数据库中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107104585 | 2018-02-09 | ||
TW107104585A TWI658404B (zh) | 2018-02-09 | 2018-02-09 | 語音辨識系統及其方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110136702A CN110136702A (zh) | 2019-08-16 |
CN110136702B true CN110136702B (zh) | 2021-05-04 |
Family
ID=67347890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810330094.7A Active CN110136702B (zh) | 2018-02-09 | 2018-04-13 | 语音识别系统及其方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110136702B (zh) |
TW (1) | TWI658404B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517683A (zh) * | 2019-09-04 | 2019-11-29 | 上海六感科技有限公司 | 头戴式vr/ar设备及其控制方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6871179B1 (en) * | 1999-07-07 | 2005-03-22 | International Business Machines Corporation | Method and apparatus for executing voice commands having dictation as a parameter |
CN101479702A (zh) * | 2006-05-05 | 2009-07-08 | 霍尼韦尔国际公司 | 用于允许在过程控制系统中故障回退到先前软件版本的装置和方法 |
CN101923484A (zh) * | 2009-06-16 | 2010-12-22 | 宏碁股份有限公司 | 电子装置、计算机可执行系统、及应用程序显示控制方法 |
CN103150250A (zh) * | 2013-02-25 | 2013-06-12 | 用友软件股份有限公司 | 应用程序性能检测系统和应用程序性能检测方法 |
CN104423941A (zh) * | 2013-08-27 | 2015-03-18 | 宏碁股份有限公司 | 电子装置及操控方法 |
CN106484119A (zh) * | 2016-10-24 | 2017-03-08 | 网易(杭州)网络有限公司 | 虚拟现实系统及虚拟现实系统输入方法 |
CN106878566A (zh) * | 2013-04-10 | 2017-06-20 | 威盛电子股份有限公司 | 语音操控方法、移动终端装置及语音操控系统 |
CN206822084U (zh) * | 2017-04-11 | 2018-01-02 | 重庆银钢科技(集团)有限公司 | 一种头盔 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8041570B2 (en) * | 2005-05-31 | 2011-10-18 | Robert Bosch Corporation | Dialogue management using scripts |
TWI344783B (en) * | 2007-04-26 | 2011-07-01 | Acer Inc | Smart phone providing remote data retrieval service and method of remote data retrieval thereof |
US9122307B2 (en) * | 2010-09-20 | 2015-09-01 | Kopin Corporation | Advanced remote control of host application using motion and voice commands |
JP6383724B2 (ja) * | 2012-07-25 | 2018-08-29 | コピン コーポレーション | ハンズフリー緊急対応を伴うヘッドセットコンピュータ |
IL298018B2 (en) * | 2013-03-11 | 2024-04-01 | Magic Leap Inc | System and method for augmentation and virtual reality |
KR102390853B1 (ko) * | 2015-03-26 | 2022-04-27 | 삼성전자주식회사 | 컨텐츠 제공 방법 및 이를 수행하는 전자 장치 |
KR20170046958A (ko) * | 2015-10-22 | 2017-05-04 | 삼성전자주식회사 | 전자 장치 및 그의 음성 인식을 이용한 기능 실행 방법 |
-
2018
- 2018-02-09 TW TW107104585A patent/TWI658404B/zh active
- 2018-04-13 CN CN201810330094.7A patent/CN110136702B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6871179B1 (en) * | 1999-07-07 | 2005-03-22 | International Business Machines Corporation | Method and apparatus for executing voice commands having dictation as a parameter |
CN101479702A (zh) * | 2006-05-05 | 2009-07-08 | 霍尼韦尔国际公司 | 用于允许在过程控制系统中故障回退到先前软件版本的装置和方法 |
CN101923484A (zh) * | 2009-06-16 | 2010-12-22 | 宏碁股份有限公司 | 电子装置、计算机可执行系统、及应用程序显示控制方法 |
CN103150250A (zh) * | 2013-02-25 | 2013-06-12 | 用友软件股份有限公司 | 应用程序性能检测系统和应用程序性能检测方法 |
CN106878566A (zh) * | 2013-04-10 | 2017-06-20 | 威盛电子股份有限公司 | 语音操控方法、移动终端装置及语音操控系统 |
CN104423941A (zh) * | 2013-08-27 | 2015-03-18 | 宏碁股份有限公司 | 电子装置及操控方法 |
CN106484119A (zh) * | 2016-10-24 | 2017-03-08 | 网易(杭州)网络有限公司 | 虚拟现实系统及虚拟现实系统输入方法 |
CN206822084U (zh) * | 2017-04-11 | 2018-01-02 | 重庆银钢科技(集团)有限公司 | 一种头盔 |
Non-Patent Citations (3)
Title |
---|
D Norris.Merging information in speech recognition: Feedback is never necessary.《 Behavioral and Brain Sciences, 2000 - pure.mpg.de》.2000,全文. * |
基于中文语音交互的虚拟装配技术研究;刘晓晖;《中国优秀硕士学位论文全文数据库》;20150215(第2期);I136-254 * |
复杂环境非特定人语音识别方法研究;王大巍;《万方数据知识服务平台》;20110928;全文 * |
Also Published As
Publication number | Publication date |
---|---|
TWI658404B (zh) | 2019-05-01 |
TW201935228A (zh) | 2019-09-01 |
CN110136702A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2990930B1 (en) | Scraped information providing method and apparatus | |
US11107467B2 (en) | Method for voice recognition and electronic device for performing same | |
US10283116B2 (en) | Electronic device and method for providing voice recognition function | |
US11429439B2 (en) | Task scheduling based on performance control conditions for multiple processing units | |
EP3000345B1 (en) | Buckle apparatus for wearable device | |
US11838445B2 (en) | Electronic apparatus for providing voice recognition control and operating method therefor | |
US20170161240A1 (en) | Web page operation method and electronic device for supporting the same | |
US20190018846A1 (en) | Content recognition apparatus and method for operating same | |
EP3062238A1 (en) | Summarization by sentence extraction and translation of summaries containing named entities | |
US20180253202A1 (en) | Electronic device and method for controlling application thereof | |
CN110136702B (zh) | 语音识别系统及其方法 | |
KR102205686B1 (ko) | 후보 문자 순위화 방법 및 장치와 문자 입력 방법 및 장치 | |
EP3330856A1 (en) | Text input method and electronic device supporting the same | |
US9924549B2 (en) | Method for connecting local communication and electronic device supporting the same | |
EP3157002A1 (en) | Electronic device and method for transforming text to speech utilizing super-clustered common acoustic data set for multi-lingual/speaker | |
US11244679B2 (en) | Electronic device, and message data output method of electronic device | |
CN109150951B (zh) | Android系统Activity的启动方法和装置 | |
US10164619B2 (en) | Electronic device and method of controlling clock frequency of electronic device | |
KR102347670B1 (ko) | 전자장치 케이스 및 이를 구비하는 전자장치 | |
US20220347566A1 (en) | Method and apparatus for pre-starting cloud application, device, storage medium, and program product | |
US11301937B1 (en) | Dynamic graphical user interface (GUI) for custom software rule creation and management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |