CN110246495A - 信息处理方法和电子设备 - Google Patents
信息处理方法和电子设备 Download PDFInfo
- Publication number
- CN110246495A CN110246495A CN201910583414.4A CN201910583414A CN110246495A CN 110246495 A CN110246495 A CN 110246495A CN 201910583414 A CN201910583414 A CN 201910583414A CN 110246495 A CN110246495 A CN 110246495A
- Authority
- CN
- China
- Prior art keywords
- voice messaging
- audio
- controlled device
- control instruction
- sent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 claims description 33
- 238000004891 communication Methods 0.000 claims description 16
- 230000002618 waking effect Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 17
- 238000004590 computer program Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开提供了一种信息处理方法,应用于音频播放设备,所述方法包括:接收语音信息;以及发送所述语音信息到识别设备,以使得所述识别设备解析所述语音信息而获得控制指令,其中,所述控制指令通过所述识别设备被发送到被控设备,使所述被控设备根据所述控制指令执行特定操作。本公开还提供了一种信息处理方法、一种电子设备。
Description
技术领域
本公开涉及一种信息处理方法和电子设备。
背景技术
音频播放设备通常可以包括麦克风和DSP芯片,由DSP芯片对麦克风接收到的语音进行语音识别。然而,通过DSP芯片对语音进行识别不仅增加了音频播放设备的制造成本、增加了布板面积,往往还达不到较好地识别效果。
发明内容
本公开的一个方面提供了一种信息处理方法,包括:接收语音信息;以及发送所述语音信息到识别设备,以使得所述识别设备解析所述语音信息而获得控制指令,其中,所述控制指令通过所述识别设备被发送到被控设备,使所述被控设备根据所述控制指令执行特定操作。
可选地,发送所述语音信息到识别设备,包括:在所述语音信息属于复杂语音信息的情况下,将所述语音信息发送到识别设备;其中,所述复杂语音信息指所述语音信息中除包括交互语音信息外还包括其他声音信息。
可选地,在所述语音信息属于复杂语音信息的情况下,将所述语音信息发送到识别设备,包括:在所述音频播放设备播放第一音频的情况下,所述语音信息属于复杂语音信息。
可选地,发送所述语音信息到识别设备,包括:保持所述第一音频的播放,并同时发送所述语音信息到识别设备。
可选地,发送所述语音信息到识别设备包括:发送所述语音信息到所述被控设备,经由所述被控设备将所述语音信息转发到所述识别设备,其中,所述被控设备与所述音频播放设备以第一通信方式通信,所述被控设备与所述识别设备以第二通信方式通信。
本公开的另一个方面提供了一种信息处理方法,应用于识别设备,所述方法包括:接收语音信息,所述语音信息是音频播放设备发送的;解析所述语音信息,以获得控制指令;以及发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作。
可选地,解析所述语音信息,以获得控制指令,以及发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作包括:在解析所述语音信息而获得唤醒词的情况下,确定所述控制指令包括控制所述音频播放设备播放提示信息;以及发送所述控制指令到所述被控设备,其中,所述被控设备包括所述音频播放设备,使所述音频播放设备播放提示信息。
可选地,接收语音信息,所述语音信息是音频播放设备发送的包括:接收来自所述被控设备的语音信息,所述被控设备的语音信息是从音频播放设备获得的,其中,所述被控设备与所述音频播放设备以第一通信方式通信,所述被控设备与所述识别设备以第二通信方式通信。
可选地,发送所述控制指令到被控设备包括:在所述语音信息中包括唤醒词的情况下,发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作,其中,所述被控设备与所述音频播放设备不同。
本公开的另一个方面提供了一种电子设备,包括:处理器;以及存储器,用于存储可执行指令,其中,当所述指令被所述处理器执行时,使得所述处理器执行上述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开的实施例的信息处理方法的应用场景;
图2示意性示出了根据本公开实施例的信息处理方法的流程图;
图3示意性示出了根据本公开实施例的发送语音信息到识别设备的示意图;
图4意性示出了根据本公开另一实施例的信息处理方法的流程图。该信息处理方法可以应用于识别设备;
图5示意性示出了根据本公开实施例的获得控制指令,并发送控制指令到被控设备的情景示意图;
图6示意性示出了根据本公开实施例的信息处理系统的框图;
图7示意性示出了根据本公开实施例的信息处理系统的框图;以及
图8示意性示出了根据本公开实施例的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开的实施例提供了一种应用于音频播放设备的信息处理方法。该方法包括:接收语音信息,并将该语音信息发送到识别设备,通过识别设备解析语音信息,从而获得该语音信息的控制指令。识别设备解析语音信息获得控制指令后可以将控制指令发送的被控设备,从而控制被控设备执行特定操作。
图1示意性示出了根据本公开的实施例的信息处理方法的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,该应用场景中包括音频播放设备,例如可以是蓝牙音箱110。该应用场景中还包括服务器120和终端设备130。
根据本公开的实施例,蓝牙音箱110可以将接收到的语音信息发送到服务器120,由服务器120对该语音信息进行解析而获得控制指令,并将获得的控制指令发送到终端设备130,从而控制终端设备130执行特定操作。
如图1所示,用户发出的语音信息例如可以是“小天,今天天气怎么样”,蓝牙音箱110将该语音信息发送到服务器120,服务器120解析该语音信息而获得控制指令,终端设备130在接收到该控制指令的情况下,自动播放今天的天气情况。
图2示意性示出了根据本公开实施例的信息处理方法的流程图。该信息处理方法可以应用于音频播放设备。
如图2所示,应用于音频播放设备的信息处理方法可以包括操作S210~S220。
在操作S210,接收语音信息。
根据本公开的实施例,音频播放设备例如可以包括麦克风,通过麦克风接收来自用户的语音信息。
例如在图1所示的情景中,音频播放设备可以是蓝牙音箱110,蓝牙音箱110包括麦克风,通过麦克风接收来自用户的语音信息。
在操作S220,发送语音信息到识别设备,以使得识别设备解析语音信息而获得控制指令,其中,控制指令通过识别设备被发送到被控设备,使被控设备根据控制指令执行特定操作。
根据本公开的实施例,识别设备例如可以是某个应用程序的服务器。该服务器对来自音频播放设备的语音信息进行解析,得到该语音信息中的语音内容。
根据本公开的实施例,例如可以是识别设备根据得到的语音内容判断该语音信息中是否包括控制指令。在语音内容中包括控制指令的情况下,将该控制指令发送到被控设备,或者将该语音内容全部发送到被控设备。根据本公开的实施例,识别设备根据得到的语音内容判断语音信息中不包括控制指令的情况下,忽略该语音信息。
例如,识别设备在确定该语音内容中包括唤醒词的情况下,识别设备确定该语音信息中包括控制指令,并将该控制指令发送到被控设备。而识别设备在确定该语音内容中不包括唤醒词的情况下,忽略该语音信息。
具体地,例如识别设备识别到的语音内容为“小天,今天天气怎么样”,识别设备识别到该语音内容中包括唤醒词“小天”,从而确定该语音内容中包括控制指令。然后识别设备将对语音信息识别后得到的控制指令“今天天气怎么样”发送到被控设备,或者识别设备也可以是将对语音信息识别后得到的包含控制指令的全部内容即“小天,今天天气怎么样”发送到被控设备。
根据本公开的实施例,在操作S220,被控设备根据控制指令执行特定操作,例如可以是被控设备可以响应于控制指令打开某个应用程序、打开某个应用程序的窗口、关闭某个应用程序、进入关机状态、进入休眠状态或者根据控制指令播放音频等等。
例如在图1所示的情景中,被控设备可以是终端设备130,终端设备130在接收到“小天,今天天气怎么样”的控制指令后,终端设备130自动播放今天的天气情况。
根据本公开的实施例,应用该信息处理方法的音频播放设备能够将获取到的语音信息发送到云端,由云端解析语音信息,从而获得语音信息中的控制指令,进而控制被控设备,从而使得音频播放设备中可以不放置DSP(Digital Signal Processing,数字信号处理)芯片,从而节省了音频播放设备的制造成本和布板面积。
根据本公开的实施例,发送语音信息到识别设备包括:音频播放设备通过第一通信方式将语音信息发送到被控设备,被控设备以第二通信方式将该语音信息发送到识别设备。
图3示意性示出了根据本公开实施例的发送语音信息到识别设备的示意图。
如图3所示,音频播放设备例如可以是蓝牙音箱110,识别设备例如可以是服务器120,被控设备例如可以是终端设备130。
蓝牙音箱110例如可以通过蓝牙与终端设备130通信,终端设备130与云端的服务器例如可以通过Wi-Fi(无线宽带)或者有线宽带进行通信。
如图3所示,蓝牙音箱110将接收到的语音信息通过蓝牙传输到终端设备130。终端设备130接收到来自该蓝牙音箱110的语音信息后,启动某个应用程序,从而通过Wi-Fi将该语音信息发送到该应用程序的服务器120上。服务器120解析来自终端设备130的语音信息,获得解析结果。在服务器120确定该语音信息中包含唤醒词的情况下,将该解析结果通过Wi-Fi发送到终端设备130,使终端设备130根据解析结果执行特定操作。
根据本公开的实施例,该方法通过被控设备将语音信息转发到服务器,不仅解决了音频播放设备无法连接网络而导致其无法与云端通信的问题,并且服务器能够根据语音信息的来源确定将解析后的语音信息发送到的被控设备。
根据本公开的实施例,发送语音信息到识别设备可以包括:在语音信息属于复杂语音信息的情况下,将语音信息发送到识别设备。其中,复杂语音信息指语音信息中除包括交互语音信息外还包括其他声音信息。
根据本公开的实施例,音频播放设备可以针对易于识别的语音信息进行识别,而将复杂的语音信息发送到识别设备,从而由识别设备对语音信息进行精准地识别,该方法能够提高语音识别的准确度,从而更好地控制被控设备。
根据本公开的实施例,例如可以是在音频播放设备识别到语音信息中包括多个具有不同声音特征的声音的情况下,确定该语音信息除包括交互语音信息还包括其他声音信息。
根据本公开的实施例,例如可以是在音频播放设备播放第一音频的情况下,语音信息属于复杂语音信息。该方法使得音频播放设备在播放第一音频的情况下,语音信息发送到识别设备,由识别设备识别语音信息,从而音频播放设备控制被控设备执行特定操作的过程不影响音频播放设备播放第一音频。同时由于复杂音频的识别需要更强的计算能力和功耗,因此将复杂音频的识别任务发送给识别设备能够进一步降低对音频播放设备的设计要求,降低成本改善用户体验。
根据本公开的实施例,在音频播放设备播放第一音频的过程中接收到语音信息的情况下,保持第一音频的播放,并同时发送语音信息到识别设备。例如,目前蓝牙音箱往往包括DSP芯片和蓝牙芯片,由DSP芯片识别来自用户的语音信息,DSP芯片将识别结果发送到蓝牙芯片。因此,在蓝牙音箱播放音频的过程中接收到语音信息的情况下,蓝牙芯片需要在接收来自终端设备的音频的同时还要接收来自DSP的识别结果,而导致蓝牙芯片的处理压力较大,往往中断音频的播放来降低蓝牙芯片的处理压力。而根据本公开的实施例,音频播放设备不需要接收来自DSP芯片的识别结果,从而能够在保持音频播放的情况下,达到唤醒被控设备的效果。
图4意性示出了根据本公开另一实施例的信息处理方法的流程图。该信息处理方法可以应用于识别设备。
如图4示,应用于识别设备的信息处理方法可以包括操作S410~S430。
在操作S410,接收语音信息,语音信息是音频播放设备发送的。
例如在图1所示的情景中,识别设备可以是服务器120,服务器120接收蓝牙音箱110发送的语音信息。
根据本公开的实施例,接收语音信息,语音信息是音频播放设备发送的包括:接收来自被控设备的语音信息,被控设备的语音信息是从音频播放设备获得的。其中,被控设备与音频播放设备以第一通信方式通信,被控设备与识别设备以第二通信方式通信。
例如在图3所示的情景中,音频播放设备例如可以是蓝牙音箱110,识别设备例如可以是服务器120,被控设备例如可以是终端设备130。蓝牙音箱110例如可以通过蓝牙与终端设备130通信,终端设备130与云端的服务器例如可以通过Wi-Fi进行通信。如图3所示,服务器120接收来自终端设备130的语音信息,而终端设备130的语音信息是从蓝牙音箱110获得的。
在操作S420,解析所述语音信息,以获得控制指令。
在操作S430,发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作。
根据本公开的实施例,在操作S420和操作S430,在识别设备解析语音信息,而确定语音信息中包括唤醒词的情况下,发送控制指令到被控设备,使被控设备根据控制指令执行特定操作,其中,所述被控设备与所述音频播放设备不同。
例如在图3所示的情景中,识别设备可以是服务器120,音频播放设备可以是蓝牙音箱110,被控设备可以是终端设备130。在该情景中,服务器120解析来自蓝牙音箱110的语音信息。在服务器120解析语音信息而获得到唤醒词的情况下,发送控制指令到终端设备130,使终端设备130根据控制指令执行特定操作。
具体地,例如服务器120识别到语音信息的内容为“小天,今天天气怎么样”,识别设备识别到该语音内容中包括唤醒词“小天”,从而识别设备将对语音信息识别后得到的控制指令“今天天气怎么样”发送到终端设备130,或者识别设备也可以是将对语音信息识别后得到的包含控制指令的全部内容即“小天,今天天气怎么样”发送到终端设备130。终端设备130在接收到“小天,今天天气怎么样”的控制指令后,终端设备130自动播放今天的天气情况。
根据本公开的另一些实施例,在操作S420和操作S430,在解析语音信息而获得唤醒词的情况下,确定控制指令包括控制音频播放设备播放提示信息;以及发送控制指令到被控设备。其中,被控设备包括音频播放设备,使音频播放设备播放提示信息。
图5示意性示出了根据本公开实施例的操作S420和操作S430获得控制指令,并发送控制指令到被控设备的情景示意图。
如图5所示,在该情景中包括音频播放设备510和识别设备520。其中,音频播放设备510同时也是被控设备。
音频播放设备510将接收到的语音信息发送到识别设备520。在识别设备520解析到该语音信息包括唤醒词的情况下,确定该语音信息包括控制音频播放设备510播放提示信息的控制指令。识别设备520将该控制指令发送到音频播放设备510,使得音频播放设备510根据控制指令播放提示信息。
具体地,例如可以是音频播放设备510接收到的语音信息是“小天,今天天气怎么样”,音频播放设备510将该语音信息发送到识别设备520。识别设备520识别到该语音信息包括唤醒词“小天”,从而确定语音信息包括控制音频播放设备510播放提示信息的控制指令,并将该控制指令“今天天气怎么样”发送到音频播放设备510。音频播放设备510响应于该控制指令,播放今天的天气情况。
根据本公开的实施例,识别设备根据得到的语音内容判断语音信息中不包括控制指令的情况下,忽略该语音信息。
本公开的另一方面提供了一种信息处理系统,该信息处理系统可以应用于音频播放设备。
图6示意性示出了根据本公开实施例的信息处理系统600的框图。
如图6所示,信息处理系统600包括第一接收模块610和第一发送模块620。
第一接收模块610,例如可以执行上文参考图2描述的操作S210,用于接收语音信息。
第一发送模块620,例如可以执行上文参考图2描述的操作S220,用于发送语音信息到识别设备,以使得识别设备解析语音信息而获得控制指令,其中,控制指令通过识别设备被发送到被控设备,使被控设备根据控制指令执行特定操作。
根据本公开的实施例,发送语音信息到识别设备,包括:在语音信息属于复杂语音信息的情况下,将语音信息发送到识别设备;其中,复杂语音信息指语音信息中除包括交互语音信息外还包括其他声音信息。
根据本公开的实施例,在语音信息属于复杂语音信息的情况下,将语音信息发送到识别设备,包括:在音频播放设备播放第一音频的情况下,语音信息属于复杂语音信息。
根据本公开的实施例,发送语音信息到识别设备,包括:保持第一音频的播放,并同时发送语音信息到识别设备。
根据本公开的实施例,发送语音信息到识别设备包括:发送语音信息到被控设备,经由被控设备将语音信息转发到识别设备,其中,被控设备与音频播放设备以第一通信方式通信,被控设备与识别设备以第二通信方式通信。
本公开的另一方面提供了另一种信息处理系统,该信息处理系统可以应用于识别设备。
图7示意性示出了根据本公开实施例的信息处理系统700的框图。
如图7所示,信息处理系统700包括第二接收模块710、解析模块720和第二发送模块730。
第二接收模块710,例如执行上文参考图4描述的操作S410,用于接收语音信息,语音信息是音频播放设备发送的。
解析模块720,例如执行上文参考图4描述的操作S420,用于解析语音信息,以获得控制指令。
第二发送模块730,例如执行上文参考图4描述的操作S430,用于发送控制指令到被控设备,使被控设备根据控制指令执行特定操作。
根据本公开的实施例,解析语音信息,以获得控制指令包括:在解析语音信息而获得唤醒词的情况下,确定控制指令包括控制音频播放设备播放提示信息;以及发送控制指令到被控设备,其中,被控设备包括音频播放设备,使音频播放设备播放提示信息。
根据本公开的实施例,接收语音信息,语音信息是音频播放设备发送的包括:接收来自被控设备的语音信息,被控设备的语音信息是从音频播放设备获得的,其中,被控设备与音频播放设备以第一通信方式通信,被控设备与识别设备以第二通信方式通信。
根据本公开的实施例,发送控制指令到被控设备包括:在语音信息中包括唤醒词的情况下,发送控制指令到被控设备,使被控设备根据控制指令执行特定操作,其中,被控设备与音频播放设备不同。
根据本公开的实施例的模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一接收模块610和第一发送模块620中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一接收模块610和第一发送模块620中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一接收模块610和第一发送模块620中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图8示意性示出了根据本公开实施例的电子设备的方框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800包括处理器810、计算机可读存储介质820。该电子设备800可以执行根据本公开实施例的方法。
具体地,处理器810例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器810还可以包括用于缓存用途的板载存储器。处理器810可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质820,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质820可以包括计算机程序821,该计算机程序821可以包括代码/计算机可执行指令,其在由处理器810执行时使得处理器810执行根据本公开实施例的方法或其任何变形。
计算机程序821可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序821中的代码可以包括一个或多个程序模块,例如包括821A、模块821B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器810执行时,使得处理器810可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,第一接收模块610和第一发送模块620中的至少一个可以实现为参考图8描述的计算机程序模块,其在被处理器810执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (10)
1.一种信息处理方法,应用于音频播放设备,所述方法包括:
接收语音信息;以及
发送所述语音信息到识别设备,以使得所述识别设备解析所述语音信息而获得控制指令,
其中,所述控制指令通过所述识别设备被发送到被控设备,使所述被控设备根据所述控制指令执行特定操作。
2.根据权利要求1中所述的方法,所述发送所述语音信息到识别设备,包括:
在所述语音信息属于复杂语音信息的情况下,将所述语音信息发送到识别设备;
其中,所述复杂语音信息指所述语音信息中除包括交互语音信息外还包括其他声音信息。
3.根据权利要求2中所述的方法,其中,在所述语音信息属于复杂语音信息的情况下,将所述语音信息发送到识别设备,包括:
在所述音频播放设备播放第一音频的情况下,所述语音信息属于复杂语音信息。
4.根据权利要求3中所述的方法,其中,所述发送所述语音信息到识别设备,包括:保持所述第一音频的播放,并同时发送所述语音信息到识别设备。
5.根据权利要1所述的方法,其中,所述发送所述语音信息到识别设备包括:
发送所述语音信息到所述被控设备,经由所述被控设备将所述语音信息转发到所述识别设备,
其中,所述被控设备与所述音频播放设备以第一通信方式通信,所述被控设备与所述识别设备以第二通信方式通信。
6.一种信息处理方法,应用于识别设备,所述方法包括:
接收语音信息,所述语音信息是音频播放设备发送的;
解析所述语音信息,以获得控制指令;以及
发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作。
7.根据权利要求6所述的方法,其中,所述解析所述语音信息,以获得控制指令,发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作包括:
在解析所述语音信息而获得唤醒词的情况下,确定所述控制指令包括控制所述音频播放设备播放提示信息;以及
发送所述控制指令到所述被控设备,其中,所述被控设备包括所述音频播放设备,使所述音频播放设备播放提示信息。
8.根据权利要求6所述的方法,其中,所述接收语音信息,所述语音信息是音频播放设备发送的包括:
接收来自所述被控设备的语音信息,所述被控设备的语音信息是从音频播放设备获得的,
其中,所述被控设备与所述音频播放设备以第一通信方式通信,所述被控设备与所述识别设备以第二通信方式通信。
9.根据权利要求6所述的方法,其中,所述发送所述控制指令到被控设备包括:
在所述语音信息中包括唤醒词的情况下,发送所述控制指令到被控设备,使所述被控设备根据所述控制指令执行特定操作,
其中,所述被控设备与所述音频播放设备不同。
10.一种电子设备,包括:
处理器;以及
存储器,用于存储可执行指令,其中,当所述指令被所述处理器执行时,使得所述处理器执行如权利要求1~9任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910583414.4A CN110246495A (zh) | 2019-06-28 | 2019-06-28 | 信息处理方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910583414.4A CN110246495A (zh) | 2019-06-28 | 2019-06-28 | 信息处理方法和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110246495A true CN110246495A (zh) | 2019-09-17 |
Family
ID=67890387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910583414.4A Pending CN110246495A (zh) | 2019-06-28 | 2019-06-28 | 信息处理方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110246495A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863923A (zh) * | 2021-01-20 | 2022-08-05 | 晶晨半导体(深圳)有限公司 | 基于Soundbar的语音控制方法、Soundbar以及服务器和语音控制系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104620597A (zh) * | 2012-09-10 | 2015-05-13 | 三星电子株式会社 | 控制与设备连接的外部装置的系统和方法 |
CN105659179A (zh) * | 2013-08-21 | 2016-06-08 | 霍尼韦尔国际公司 | 用于与hvac控制器相交互的设备和方法 |
CN106251873A (zh) * | 2016-07-29 | 2016-12-21 | 镇江惠通电子有限公司 | 语音控制方法及语音控制系统 |
CN107319857A (zh) * | 2017-06-30 | 2017-11-07 | 广东工业大学 | 一种交互镜子及具有该交互镜子的智能家电系统 |
CN108509225A (zh) * | 2018-03-28 | 2018-09-07 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108683574A (zh) * | 2018-04-13 | 2018-10-19 | 青岛海信智慧家居系统股份有限公司 | 一种设备控制方法、服务器和智能家居系统 |
CN109074808A (zh) * | 2018-07-18 | 2018-12-21 | 深圳魔耳智能声学科技有限公司 | 语音控制方法、中控设备和存储介质 |
CN109273006A (zh) * | 2018-09-28 | 2019-01-25 | 上汽通用五菱汽车股份有限公司 | 车载系统的语音控制方法、车载系统、车辆及存储介质 |
CN109377992A (zh) * | 2018-10-10 | 2019-02-22 | 四川长虹电器股份有限公司 | 基于无线通信的全空间语音交互物联网控制系统及方法 |
CN109445741A (zh) * | 2018-09-30 | 2019-03-08 | Oppo广东移动通信有限公司 | 数据传输方法、装置、电子设备及存储介质 |
CN109584872A (zh) * | 2018-12-10 | 2019-04-05 | 深圳创维-Rgb电子有限公司 | 一种语音控制系统、控制方法、设备及介质 |
CN109712623A (zh) * | 2018-12-29 | 2019-05-03 | Tcl通力电子(惠州)有限公司 | 语音控制方法、装置及计算机可读存储介质 |
-
2019
- 2019-06-28 CN CN201910583414.4A patent/CN110246495A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104620597A (zh) * | 2012-09-10 | 2015-05-13 | 三星电子株式会社 | 控制与设备连接的外部装置的系统和方法 |
CN105659179A (zh) * | 2013-08-21 | 2016-06-08 | 霍尼韦尔国际公司 | 用于与hvac控制器相交互的设备和方法 |
CN106251873A (zh) * | 2016-07-29 | 2016-12-21 | 镇江惠通电子有限公司 | 语音控制方法及语音控制系统 |
CN107319857A (zh) * | 2017-06-30 | 2017-11-07 | 广东工业大学 | 一种交互镜子及具有该交互镜子的智能家电系统 |
CN108509225A (zh) * | 2018-03-28 | 2018-09-07 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108683574A (zh) * | 2018-04-13 | 2018-10-19 | 青岛海信智慧家居系统股份有限公司 | 一种设备控制方法、服务器和智能家居系统 |
CN109074808A (zh) * | 2018-07-18 | 2018-12-21 | 深圳魔耳智能声学科技有限公司 | 语音控制方法、中控设备和存储介质 |
CN109273006A (zh) * | 2018-09-28 | 2019-01-25 | 上汽通用五菱汽车股份有限公司 | 车载系统的语音控制方法、车载系统、车辆及存储介质 |
CN109445741A (zh) * | 2018-09-30 | 2019-03-08 | Oppo广东移动通信有限公司 | 数据传输方法、装置、电子设备及存储介质 |
CN109377992A (zh) * | 2018-10-10 | 2019-02-22 | 四川长虹电器股份有限公司 | 基于无线通信的全空间语音交互物联网控制系统及方法 |
CN109584872A (zh) * | 2018-12-10 | 2019-04-05 | 深圳创维-Rgb电子有限公司 | 一种语音控制系统、控制方法、设备及介质 |
CN109712623A (zh) * | 2018-12-29 | 2019-05-03 | Tcl通力电子(惠州)有限公司 | 语音控制方法、装置及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863923A (zh) * | 2021-01-20 | 2022-08-05 | 晶晨半导体(深圳)有限公司 | 基于Soundbar的语音控制方法、Soundbar以及服务器和语音控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11502859B2 (en) | Method and apparatus for waking up via speech | |
JP2020190752A (ja) | 記録メディアのホットワードトリガ抑制 | |
US11587560B2 (en) | Voice interaction method, device, apparatus and server | |
US20210280172A1 (en) | Voice Response Method and Device, and Smart Device | |
US8315866B2 (en) | Generating representations of group interactions | |
EP2389672B1 (en) | Method, apparatus and computer program product for providing compound models for speech recognition adaptation | |
US20090034750A1 (en) | System and method to evaluate an audio configuration | |
JP2021071733A (ja) | オーディオ透かしによるキーフレーズ検出 | |
CN109284080B (zh) | 音效调整方法、装置、电子设备以及存储介质 | |
US10049658B2 (en) | Method for training an automatic speech recognition system | |
CN112017650B (zh) | 电子设备的语音控制方法、装置、计算机设备和存储介质 | |
US8682678B2 (en) | Automatic realtime speech impairment correction | |
CN108062212A (zh) | 一种基于场景的语音操作方法及装置 | |
CN109741753A (zh) | 一种语音交互方法、装置、终端及服务器 | |
US10755707B2 (en) | Selectively blacklisting audio to improve digital assistant behavior | |
CN110428835A (zh) | 一种语音设备的调节方法、装置、存储介质及语音设备 | |
CN111833857A (zh) | 语音处理方法、装置和分布式系统 | |
CN113823334A (zh) | 一种应用于车载设备的环境模拟方法、相关装置及设备 | |
CN109981448A (zh) | 信息处理方法和电子设备 | |
US20220215839A1 (en) | Method for determining voice response speed, related device and computer program product | |
CN110246495A (zh) | 信息处理方法和电子设备 | |
EP2849341A1 (en) | Loudness control at audio rendering of an audio signal | |
CN112712799B (zh) | 一种误触发语音信息的获取方法、装置、设备及存储介质 | |
CN112017651B (zh) | 电子设备的语音控制方法、装置、计算机设备和存储介质 | |
CN112562688A (zh) | 语音转写方法、装置、录音笔和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190917 |