CN113409758A - 一种智能语音的交互方法、装置和系统 - Google Patents
一种智能语音的交互方法、装置和系统 Download PDFInfo
- Publication number
- CN113409758A CN113409758A CN202110647630.8A CN202110647630A CN113409758A CN 113409758 A CN113409758 A CN 113409758A CN 202110647630 A CN202110647630 A CN 202110647630A CN 113409758 A CN113409758 A CN 113409758A
- Authority
- CN
- China
- Prior art keywords
- instruction
- processing instruction
- target
- scene
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004891 communication Methods 0.000 claims description 9
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005389 magnetism Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种智能语音的交互方法、装置和系统,该方法应用于便携式智能设备,包括:在与目标底座连接的情况下,获取目标底座的标识信息,根据标识信息确定与目标底座对应的目标应用场景;接收语音信号,并获取与语音信号对应的处理指令;基于处理指令以及目标应用场景执行对应的目标操作。由于用户可以携带便携式智能设备至任一场景,且在任一场景中,便携式智能设备均可以通过目标底座的标识信息识别该场景,并进行在该场景下的智能语音交互,因此,可以实现通过同一设备在不同场景下进行智能语音交互的目的,此外,由于可以共用同一套软硬件设备实现不同场景下的智能语音交互,因此,可以保障不同场景下智能语音交互体验的一致性。
Description
技术领域
本申请涉及智能语音技术领域,尤其涉及一种智能语音的交互方法、装置和系统。
背景技术
目前,在不同的应用场景下,用户可以与设备进行智能语音交互。例如,在车载场景中,用户可以与车辆中的车载中控系统进行智能语音交互,以控制车辆执行相应操作。再例如,在家庭场景中,用户可以与智能家电进行智能语音交互,以控制智能家电执行相应操作。
然而,随着用户对生活多样化的需求,越来越多的用户希望可以借助于同一设备实现不同场景下的智能语音交互,而目前还缺少一种有效的方案可以实现这样的目的。
发明内容
本申请实施例提供一种智能语音交互方法、装置和系统,用于解决目前无法通过同一设备实现不同场景下的智能语音交互的问题。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出一种智能语音的交互方法,应用于便携式智能设备,包括:
在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
接收语音信号,并获取与所述语音信号对应的处理指令;
基于所述处理指令以及所述目标应用场景执行对应的目标操作。
第二方面,提出一种智能语音的交互装置,包括:
场景确定单元,在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
指令获取单元,接收语音信号,并获取与所述语音信号对应的处理指令;
指令执行单元,基于所述处理指令以及所述目标应用场景执行对应的目标操作。
第三方面,提出一种电子设备,包括处理器以及与处理器电连接的存储器,所述存储器存储有程序或者指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法。
第四方面,提出一种可读存储介质,所述可读存储介质上存储有程序或指令,所述程序或指令在被处理器执行时实现如第一方面所述的方法。
第五方面,提出一种智能语音的交互系统,所述系统包括便携式智能设备和目标底座,其中:
在所述便携式智能设备与所述目标底座连接的情况下,所述便携式智能设备获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
所述便携式智能设备接收语音信号,并获取与所述语音信号对应的处理指令;
所述便携式智能设备基于所述处理指令以及所述目标应用场景执行对应的目标操作。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
本申请实施例可以预先针对不同的应用场景设置对应的底座标识信息,在用户携带便携式智能设备且该将该便携式智能设备与某个目标底座连接的情况下,便携式智能设备可以获取目标底座的标识信息,并根据标识信息确定对应的目标应用场景,在接收到语音信号并获取语音信号对应的处理指令时,可以根据处理指令和目标应用场景执行相应的操作。这样,由于用户可以携带便携式智能设备至任一应用场景,且在任一场景中,便携式智能设备均可以通过目标底座的标识信息识别该场景,并进行在该场景下的智能语音交互,因此,可以实现通过同一设备在不同场景下进行智能语音交互的目的。此外,由于本申请实施例可以共用同一套软硬件设备实现不同应用场景下的智能语音交互,因此,还可以保障不同场景下智能语音交互体验的一致性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一个实施例智能语音的交互方法的流程示意图;
图2是本申请的一个实施例智能语音的交互方法的流程示意图;
图3是本申请的一个实施例电子设备的结构示意图;
图4是本申请的一个实施例智能语音的交互装置的结构示意图;
图5是本申请的一个实施例智能语音的交互系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请实施例提供的智能语音交互方法可以应用于便携式智能设备,该便携式智能设备至少可以具备语音的收发功能、语音识别功能、与底座连接并与底座进行数据交互的功能,其中,底座还可以为便携式智能设备供电。可选地,便携式智能设备还可以具备通过网络与服务端进行交互的功能,或者还可以具备语音信号的识别和解析功能。
在一种可能的实现方式中,便携式智能设备具体可以由以下几部分组成:从文本到语音(Text To Speech,TTS)播报系统、拾音麦克风、网络通讯模块、底座接插件。其中,TTS播报系统用于向外发出语音,拾音麦克风用于接收外界的语音,网络通讯模块用于与服务端进行通讯,底座接插件可以是磁吸式的底座接插件(便于便携式智能设备通过磁吸式的方式与底座连接),比如可收缩的磁吸插头,也可以是使用其他连接方式的底座接插件。可选地,便携式智能设备还可以包括交互信息显示屏,该显示屏可以显示便携式智能设备与底座和/或服务端的交互信息,此外,该显示屏也可以显示便携式智能设备的属性信息和/或功能信息等,用户可以通过该显示屏对便携式智能设备的属性和功能等进行设置。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1是本申请的一个实施例智能语音的交互方法的流程示意图。所述方法可以应用于上述便携式智能设备,具体包括以下步骤。
S102:在与目标底座连接的情况下,获取目标底座的标识信息,根据标识信息确定与目标底座对应的目标应用场景。
本实施例中,智能语音交互的应用场景可以包含多种,不同的底座可以具有不同的标识信息,可以预先针对不同的应用场景和不同的标识信息建立对应关系。当用户需要在某个应用场景下进行智能语音交互时,可以携带便携式智能设备至该应用场景中,同时,还可以在该应用场景中放置底座,该底座的标识信息与该应用场景具有预设的对应关系。
针对某个应用场景而言,当用户携带便携式智能设备至该应用场景后,在需要进行智能语音交互的情况下,用户可以将便携式智能设备与该场景中预先放置的底座(为了便于区分,以下由目标底座表示)连接。在便携式智能设备与目标底座连接的情况下,便携式智能设备可以与目标底座之间进行数据交互。通过数据交互,便携式智能设备可以获取到目标底座的标识信息。在获取到目标底座的标识信息后,便携式智能设备可以根据该标识信息,以及预先设置的标识信息与应用场景之间的对应关系,进一步确定与目标底座对应的应用场景(为了便于区分,以下由目标应用场景表示),该目标应用场景即为当前智能语音交互的应用场景。
在一种实现方式中,上述目标底座的标识信息具体可以是目标底座的设备标识。便携式智能设备在与目标底座进行数据交互的情况下,可以识别得到目标底座的设备标识。
在另一种实现方式中,上述目标底座的标识信息具体可以是在目标底座与便携式智能设备的通信协议中预定义的指定字段。具体地,可以在目标底座与便携式智能设备的通信协议中预先定义一些字段(即指定字段),比如,在通信协议中添加一部分子段作为指定字段,其中,针对不同的应用场景可以定义不同的字段。这样,在便携式智能设备和目标底座连接后,便携式智能设备在与目标底座通信时,可以获取得到通信协议中的指定字段,根据该指定字段进一步确定对应的目标应用场景。
应理解,在其他实现方式中,目标底座的标识信息还可以是其他标识信息,只要可以区别不同的应用场景即可,这里不再一一举例说明。
S104:接收语音信号,并获取与语音信号对应的处理指令。
便携式智能设备在识别得到目标应用场景的情况下,当接收到来自外界的语音信号(比如用户发出的语音)时,可以获取与语音信号对应的处理指令。
本实施例中,便携式智能设备在获取处理指令时,可以借助于服务端实现,也可以在本地实现。在借助于服务端获取处理指令时,首先,便携式设备在接收到语音信号后,可以对语音信号进行语音识别,得到对应的文本信息。比如,可以通过ASR将音频信息转化为文本信息。在得到文本信息后,可以将文本信息发送给服务端。其中,便携式智能设备在与底座连接时可以同时连接到网络,在将文本信息发送服务端时,可以通过网络进行发送。便携式智能设备连接到网络,具体可以是通过USB协议与网络连接,也可以是在首次与底座连接时由用户将便携式智能设备连接到网络,在后续与底座再次连接时,便携式智能设备可以自动连接至网络。当然,还可以通过其他实现方式连接到网络,这里不再一一举例说明。
服务端在接收到文本信息后,可以对文本信息进行语义解析,得到解析结果,该解析结果可以表征语音信号的意图。在得到解析结果后,服务端可以根据解析结果进一步得到处理指令。其中,服务端进行语义解析的具体实现方式可以参见现有技术中记载的方法,这里不再详细说明。服务端在得到处理指令后,可以将处理指令返回给便携式智能设备。
在便携式智能设备在本地获取处理指令的情况下,具体地,首先,便携式智能设备在接收到语音信号后,可以对语音信号进行语音识别,得到对应的文本信息;其次,基于文本信息进行语义解析,得到解析结果;最后,根据解析结果进一步得到处理指令。
需要说明的是,上述借助于服务端获取处理指令和在本地获取处理指令的区别在于,执行语义解析操作的执行主体不同,其中,在借助于服务端获取处理指令时,语义解析的执行主体是服务端,在本地获取处理指令时,执行主体是便携式智能设备。在实际应用中,若便携式智能设备具备语义解析的能力,则优选在本地进行语义解析并得到处理指令,无需将文本信息上传至服务端进行语义解析。反之,若便携式智能设备不具备语义解析的能力,则需要将文本信息上传至服务端进行语义解析。
S106:基于处理指令以及目标应用场景执行对应的目标操作。
便携式智能设备在获取到处理指令后,可以基于处理指令以及S102中确定的目标应用场景执行对应的目标操作。
本实施例中,上述S102根据目标底座的标识信息确定得到的目标应用场景可以是车载场景,也可以是家庭场景。在基于处理指令和目标应用场景执行对应的目标操作时,可以针对车载场景和家庭场景执行不同的目标操作。以下将分别进行说明。
在目标应用场景为车载场景的情况下,考虑到便携式智能设备接收到的语音可能是想要便携式智能设备执行某种操作(比如与便携式智能设备进行人机交互的场景),也可以是用户想要车辆执行某种操作,而在需要车辆执行某种操作的情况下,便携式智能设备通常不能直接与车辆中的部件进行交互,但是可以与车辆中的车载中控系统进行交互,车载中控系统可以直接对车辆中的部件进行控制,因此,可以将车载场景下的处理指令划分为不同的指令类型,便携式智能设备在基于处理指令以及目标应用场景执行对应的目标操作时,首先可以判断在车载场景下处理指令的指令类型,然后执行与确定得到的指令类型对应的目标操作。其中,处理指令的指令类型至少可以包括第一类型和第二类型,第一类型的指令表征可以由车辆中的车载中控系统执行的指令,第二类型的指令表征由便携式智能设备执行的指令。
在判断处理指令的指令类型时,在一种可能的实现方式中,考虑到处理指令中通常会涉及指令的执行对象,因此,可以通过处理指令所涉及的执行对象判断指令的类型。具体地,可以判断处理指令的执行对象是否为预设的执行对象;若是,则确定处理指令的指令类型为第一类型;若否,则确定处理指令的指令类型为第二类型。其中,预设的执行对象可以是车辆中的任一部件的名称,该部件可以是车辆中的软件,比如音乐播放器等,也可以是车辆中的硬件,比如空调等。
以预设的执行对象包括空调为例,若处理指令为“打开空调”,则可以确定处理指令的执行对象为预设的执行对象,处理指令的指令类型为第一类型。若处理指令为“播报一小时后的天气”,则可以确定处理指令的执行对象不为预设的执行对象,处理指令的指令类型为第二类型。
在确定处理指令的指令类型后,若判断结果为上述第一类型,则便携式智能设备可以将处理指令发送给车载中控系统。车载中控系统在接收到处理指令后,可以执行与处理指令对应的操作。比如,若处理指令为“打开音乐播放器中的XX歌曲”,则车载中控系统可以控制车辆中的音乐播放器播放歌曲“XX”。若判断结果为第二类型,则可以由便携式智能设备本身执行与处理指令对应的操作。比如,若处理指令为“播报一小时后的天气”,该操作可以是便携式智能设备进行TTS播报。
可选地,在处理指令的指令类型为第一类型的情况下,考虑到可能会涉及用户、便携式智能设备和车载中控系统之间的多人对话场景,因此,车载中控系统在执行与处理指令对应的操作后,还可以将执行结果返回给便携式智能设备,以实现多人对话的目的。
这样,在车载场景下,通过判断处理指令的类型,在第一类型的情况下由车载中控系统执行对应的操作,在第二类型的情况下由便携式智能设备执行对应的操作,可以实现在车载场景下的智能语音交互。
在目标应用场景为家庭场景的情况下,考虑到便携式智能设备接收到的语音通常是想要智能家电执行某种操作,而便携式智能设备通常可以直接与智能家电进行交互,因此,在家庭场景下可以无需对处理指令划分指令类型,便携式智能设备在基于处理指令以及目标应用场景执行对应的目标操作时,可以确定在家庭场景下与处理指令匹配的智能家电,然后将处理指令发送给智能家电,由智能家电执行与处理指令对应的操作。
本实施例中,可以预先将便携式智能设备与家庭环境中的智能家电进行绑定。比如,在首次将便携式智能设备与家庭环境下的底座连接时,用户可以通过手机APP将便携式智能设备与家庭环境中的智能家电进行绑定。此外,还可以将智能家电的相关指令预先存储在便携式智能设备中。这样,在确定家庭环境下与处理指令匹配的智能家电时,可以将处理指令与预先存储的智能家电的指令进行匹配,从而可以确定出与处理指令相匹配的智能家电。当然,在其他实现方式中,也可以通过其他方法确定出与处理指令相匹配的智能家电,这里不再一一举例说明。
在确定出相匹配的智能家电后,可以直接将处理指令发送给智能家电,智能家电在接收到处理指令后,可以执行与处理指令对应的操作。比如,若处理指令为“开启空调,20度”,则便携式智能设备会将指令发送给智能空调,智能空调将会自动打开并调温至20度。
可选地,智能家电在执行与处理指令对应的操作后,也可以将执行结果返回给便携式智能设备,以便确认是否成功执行。若成功执行,则可以语音提示用户,若执行失败,则用户可以再次进行语音交互。
为了便于理解本申请实施例提供的技术方案,以下将以车载场景和家庭场景为例进行说明。具体请参见图2。
图2是本申请的一个实施例智能语音的交互方法的流程示意图。图2所示的实施例的执行主体可以是便携式智能设备,具体包括以下步骤。
S201:在与目标底座连接的情况下,获取目标底座的标识信息。
S202:根据标识信息确定与目标底座对应的目标应用场景。
S203:接收语音信号,并获取与语音信号对应的处理指令。
若S202中确定的目标应用场景为车载场景,则可以执行S204;若目标应用场景为家庭场景,则可以执行S207。
S204:判断在车载场景下处理指令的指令类型。
若指令类型为第一类型,则执行S205;若指令类型为第二类型,则执行S206。其中,第一类型的指令由车载中控系统执行,第二类型的指令由便携式智能设备执行。
S205:将处理指令发送给车载中控系统,由车载中控系统执行与处理指令对应的操作。
S206:执行与处理指令对应的操作。
S207:确定在家庭场景下与处理指令匹配的智能家电。
S208:将处理指令发送给智能家电,由智能家电执行与处理指令对应的操作。
本申请实施例可以预先针对不同的应用场景设置对应的底座标识信息,在用户携带便携式智能设备且该将该便携式智能设备与某个目标底座连接的情况下,便携式智能设备可以获取目标底座的标识信息,并根据标识信息确定对应的目标应用场景,在接收到语音信号并获取语音信号对应的处理指令时,可以根据处理指令和目标应用场景执行相应的操作。这样,由于用户可以携带便携式智能设备至任一应用场景,且在任一场景中,便携式智能设备均可以通过目标底座的标识信息识别该场景,并进行在该场景下的智能语音交互,因此,可以实现通过同一设备在不同场景下进行智能语音交互的目的。此外,由于本申请实施例可以共用同一套软硬件设备实现不同应用场景下的智能语音交互,因此,还可以保障不同场景下智能语音交互体验的一致性。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图3是本申请的一个实施例电子设备的结构示意图。请参考图3,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成智能语音的交互装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
接收语音信号,并获取与所述语音信号对应的处理指令;
基于所述处理指令以及所述目标应用场景执行对应的目标操作。
上述如本申请图3所示实施例揭示的智能语音的交互装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1和图2的方法,并实现智能语音的交互装置在图1和图2所示实施例中的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
接收语音信号,并获取与所述语音信号对应的处理指令;
基于所述处理指令以及所述目标应用场景执行对应的目标操作。
图4是本申请的一个实施例智能语音的交互装置40的结构示意图。请参考图4,在一种软件实施方式中,所述智能语音的交互装置40可包括:场景确定单元41、指令获取单元42和指令执行单元43,其中:
场景确定单元41,在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
指令获取单元42,接收语音信号,并获取与所述语音信号对应的处理指令;
指令执行单元43,基于所述处理指令以及所述目标应用场景执行对应的目标操作。
可选地,所述标识信息包括以下至少一种:
所述目标底座的设备标识;
在所述目标底座与所述便携式智能设备的通信协议中预定义的指定字段。
可选地,所述目标应用场景包括车载场景和家庭场景。
可选地,根据所述标识信息确定所述目标应用场景为所述车载场景时,所述指令执行单元43基于所述处理指令以及所述目标应用场景执行对应的目标操作,包括:
判断在所述车载场景下所述处理指令的指令类型;
执行与所述指令类型对应的目标操作。
可选地,所述指令类型包括第一类型和第二类型;其中,所述指令执行单元43判断在所述车载场景下所述处理指令的指令类型,包括:
判断所述处理指令的执行对象是否为预设的执行对象;
若是,则确定所述处理指令的指令类型为所述第一类型;
若否,则确定所述处理指令的指令类型为所述第二类型。
可选地,所述第一类型的指令由车载中控系统执行,所述第二类型的指令由所述便携式智能设备执行;
其中,所述指令执行单元43执行与所述指令类型对应的目标操作,包括:
在所述指令类型为所述第一类型的情况下,将所述处理指令发送给所述车载中控系统,由所述车载中控系统执行与所述处理指令对应的操作;
在所述指令类型为所述第二类型的情况下,执行与所述处理指令对应的操作。
可选地,根据所述标识信息确定所述目标应用场景为所述家庭场景时,所述指令执行单元43基于所述处理指令以及所述目标应用场景执行对应的目标操作,包括:
确定在所述家庭场景下与所述处理指令匹配的智能家电;
将所述处理指令发送给所述智能家电,由所述智能家电执行与所述处理指令对应的操作。
本申请实施例提供的智能语音的交互装置40还可执行图1和图2的方法,并实现智能语音的交互装置在图1和图2所示实施例的功能,本申请实施例在此不再赘述。
图5是本申请的一个实施例智能语音的交互系统50的结构示意图。该交互系统50包括便携式智能设备51和目标底座52,其中:
在所述便携式智能设备51与所述目标底座52连接的情况下,所述便携式智能设备51获取所述目标底座52的标识信息,根据所述标识信息确定与所述目标底座52对应的目标应用场景;
所述便携式智能设备51接收语音信号,并获取与所述语音信号对应的处理指令;
所述便携式智能设备51基于所述处理指令以及所述目标应用场景执行对应的目标操作。
本实施例中,便携式智能设备51可以实现图1和图2所示实施例中便携式智能设备所实现的功能,目标底座52可以实现图1和图2所示实施例中目标底座所实现的功能,这里都不再重复说明。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (10)
1.一种智能语音的交互方法,其特征在于,应用于便携式智能设备,所述方法包括:
在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
接收语音信号,并获取与所述语音信号对应的处理指令;
基于所述处理指令以及所述目标应用场景执行对应的目标操作。
2.如权利要求1所述的方法,其特征在于,所述标识信息包括以下至少一种:
所述目标底座的设备标识;
在所述目标底座与所述便携式智能设备的通信协议中预定义的指定字段。
3.如权利要求1所述的方法,其特征在于,
所述目标应用场景包括车载场景和家庭场景。
4.如权利要求3所述的方法,其特征在于,根据所述标识信息确定所述目标应用场景为所述车载场景时,所述基于所述处理指令以及所述目标应用场景执行对应的目标操作包括:
判断在所述车载场景下所述处理指令的指令类型;
执行与所述指令类型对应的目标操作。
5.如权利要求4所述的方法,其特征在于,所述指令类型包括第一类型和第二类型;其中,判断在所述车载场景下所述处理指令的指令类型,包括:
判断所述处理指令的执行对象是否为预设的执行对象;
若是,则确定所述处理指令的指令类型为所述第一类型;
若否,则确定所述处理指令的指令类型为所述第二类型。
6.如权利要求5所述的方法,其特征在于,所述第一类型的指令由车载中控系统执行,所述第二类型的指令由所述便携式智能设备执行;
其中,执行与所述指令类型对应的目标操作,包括:
在所述指令类型为所述第一类型的情况下,将所述处理指令发送给所述车载中控系统,由所述车载中控系统执行与所述处理指令对应的操作;
在所述指令类型为所述第二类型的情况下,执行与所述处理指令对应的操作。
7.如权利要求3所述的方法,其特征在于,根据所述标识信息确定所述目标应用场景为所述家庭场景时,所述基于所述处理指令以及所述目标应用场景执行对应的目标操作,包括:
确定在所述家庭场景下与所述处理指令匹配的智能家电;
将所述处理指令发送给所述智能家电,由所述智能家电执行与所述处理指令对应的操作。
8.一种智能语音的交互装置,其特征在于,包括:
场景确定单元,在与目标底座连接的情况下,获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
指令获取单元,接收语音信号,并获取与所述语音信号对应的处理指令;
指令执行单元,基于所述处理指令以及所述目标应用场景执行对应的目标操作。
9.一种电子设备,其特征在于,包括处理器以及与处理器电连接的存储器,所述存储器存储有程序或者指令,所述程序或指令被所述处理器执行时实现如权利要求1至7任一项所述的方法。
10.一种智能语音的交互系统,其特征在于,包括便携式智能设备和目标底座,其中:
在所述便携式智能设备与所述目标底座连接的情况下,所述便携式智能设备获取所述目标底座的标识信息,根据所述标识信息确定与所述目标底座对应的目标应用场景;
所述便携式智能设备接收语音信号,并获取与所述语音信号对应的处理指令;
所述便携式智能设备基于所述处理指令以及所述目标应用场景执行对应的目标操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647630.8A CN113409758A (zh) | 2021-06-10 | 2021-06-10 | 一种智能语音的交互方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110647630.8A CN113409758A (zh) | 2021-06-10 | 2021-06-10 | 一种智能语音的交互方法、装置和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113409758A true CN113409758A (zh) | 2021-09-17 |
Family
ID=77683414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110647630.8A Pending CN113409758A (zh) | 2021-06-10 | 2021-06-10 | 一种智能语音的交互方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113409758A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115225477A (zh) * | 2022-07-19 | 2022-10-21 | 北京天融信网络安全技术有限公司 | 机框式设备的配置维护方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107134286A (zh) * | 2017-05-15 | 2017-09-05 | 深圳米唐科技有限公司 | 基于语音交互的无线音频播放方法、音乐播放器及存储介质 |
CN108346431A (zh) * | 2018-01-16 | 2018-07-31 | 中电福富信息科技有限公司 | 基于tcp通道的车载智能语音拓展系统及拓展方法 |
CN108415683A (zh) * | 2018-03-07 | 2018-08-17 | 深圳车盒子科技有限公司 | 多场景语音辅助方法、智能语音系统、设备及存储介质 |
US20190057695A1 (en) * | 2017-08-21 | 2019-02-21 | Baidu Online Network Technology (Beijing) Co., Ltd . | Method for controlling smart device, computer device and storage medium |
CN110001526A (zh) * | 2019-04-24 | 2019-07-12 | 美高卡兰光电科技(北京)有限公司 | 汽车摄像调整方法及装置 |
CN111142826A (zh) * | 2019-12-30 | 2020-05-12 | 深圳创维-Rgb电子有限公司 | 移动设备、底座以及场景系统 |
US20210097993A1 (en) * | 2019-09-29 | 2021-04-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech recognition control method and apparatus, electronic device and readable storage medium |
-
2021
- 2021-06-10 CN CN202110647630.8A patent/CN113409758A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107134286A (zh) * | 2017-05-15 | 2017-09-05 | 深圳米唐科技有限公司 | 基于语音交互的无线音频播放方法、音乐播放器及存储介质 |
US20190057695A1 (en) * | 2017-08-21 | 2019-02-21 | Baidu Online Network Technology (Beijing) Co., Ltd . | Method for controlling smart device, computer device and storage medium |
CN108346431A (zh) * | 2018-01-16 | 2018-07-31 | 中电福富信息科技有限公司 | 基于tcp通道的车载智能语音拓展系统及拓展方法 |
CN108415683A (zh) * | 2018-03-07 | 2018-08-17 | 深圳车盒子科技有限公司 | 多场景语音辅助方法、智能语音系统、设备及存储介质 |
CN110001526A (zh) * | 2019-04-24 | 2019-07-12 | 美高卡兰光电科技(北京)有限公司 | 汽车摄像调整方法及装置 |
US20210097993A1 (en) * | 2019-09-29 | 2021-04-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech recognition control method and apparatus, electronic device and readable storage medium |
CN111142826A (zh) * | 2019-12-30 | 2020-05-12 | 深圳创维-Rgb电子有限公司 | 移动设备、底座以及场景系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115225477A (zh) * | 2022-07-19 | 2022-10-21 | 北京天融信网络安全技术有限公司 | 机框式设备的配置维护方法、装置、电子设备和存储介质 |
CN115225477B (zh) * | 2022-07-19 | 2023-12-01 | 北京天融信网络安全技术有限公司 | 机框式设备的配置维护方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11240050B2 (en) | Online document sharing method and apparatus, electronic device, and storage medium | |
CN105719649B (zh) | 语音识别方法及装置 | |
US10311877B2 (en) | Performing tasks and returning audio and visual answers based on voice command | |
CN109428911A (zh) | 设备控制方法、装置、终端设备和操作系统 | |
CN107277225B (zh) | 语音控制智能设备的方法、装置和智能设备 | |
US11200899B2 (en) | Voice processing method, apparatus and device | |
WO2021073235A1 (zh) | 一种内容展示方法、装置及电子设备 | |
CN108829481B (zh) | 基于控制电子设备的遥控器界面的呈现方法 | |
CN106528255B (zh) | 类加载方法及装置 | |
WO2016155633A1 (zh) | 信息联动方法、装置、服务端和系统 | |
CN110278273B (zh) | 多媒体文件上传方法、装置、终端、服务器和存储介质 | |
CN113409758A (zh) | 一种智能语音的交互方法、装置和系统 | |
CN107608660B (zh) | 共享技能应用方法及系统 | |
CN111050217B (zh) | 一种视频播放方法及装置 | |
CN111478982B (zh) | 消息处理方法、装置、系统及电子设备 | |
CN105677435A (zh) | 函数的调用方法、装置及终端 | |
US20150052145A1 (en) | Electronic device and method capable of searching application | |
CN114527983A (zh) | 一种基于中间件的接口适配方法、装置及电子设备 | |
CN112257038A (zh) | 课件防盗方法、系统、电子设备及存储介质 | |
CN111552606B (zh) | 数据处理方法、装置及电子设备 | |
CN109542775B (zh) | 一种测试脚本的生成和执行方法及装置 | |
US11010041B2 (en) | Method and apparatus for displaying interface | |
CN115221444A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN107330025B (zh) | 一种推荐歌曲的方法和装置 | |
US9189633B2 (en) | Download management method and device based on android browser |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210917 |
|
RJ01 | Rejection of invention patent application after publication |