CN107026943A - 语音交互方法及系统 - Google Patents
语音交互方法及系统 Download PDFInfo
- Publication number
- CN107026943A CN107026943A CN201710205165.6A CN201710205165A CN107026943A CN 107026943 A CN107026943 A CN 107026943A CN 201710205165 A CN201710205165 A CN 201710205165A CN 107026943 A CN107026943 A CN 107026943A
- Authority
- CN
- China
- Prior art keywords
- interactive
- opposite equip
- voice messaging
- sent
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000003993 interaction Effects 0.000 claims abstract description 89
- 238000004891 communication Methods 0.000 claims abstract description 21
- 230000008859 change Effects 0.000 claims description 10
- 241000208340 Araliaceae Species 0.000 claims description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 2
- 235000008434 ginseng Nutrition 0.000 claims description 2
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 4
- 230000009897 systematic effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2245—Management of the local loop plant
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5183—Call or contact centers with computer-telephony arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2254—Arrangements for supervision, monitoring or testing in networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开提供了一种语音交互方法,该方法包括:接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及将接收到的第一语音信息发送给至少一个交互对端设备。本公开还提供了一种语音交互系统。
Description
技术领域
本公开涉及一种语音交互方法及系统。
背景技术
对于比较大的房子,特别是具备多个楼层的房子,有时候一个房间的人要想和另外一个房间的人说话,就会比较麻烦,一般需要跑过去当面沟通才行。有时候太累了或者有急事,就显得很不方便。
目前,对于上述问题,相关技术中提供了两种解决方案:(1)安装专门的对讲系统;(2)使用对讲机。发明人发现,方案(1)存在如下缺点:价格贵,需要布线等复杂的安装;方案(2)存在如下缺点:对于家庭场景来说,不适合,使用不方便。
针对相关技术中的上述问题,目前还未提出有效的解决方案。
发明内容
本发明实施例提供了一种语音交互方法及系统,以至少解决相关技术中处在同一区域的内部人员之间沟通不便技术问题。
本公开的一个方面提供了一种语音交互方法,包括:接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及将接收到的上述第一语音信息发送给至少一个交互对端设备。
可选地,在将接收到的上述第一语音信息发送给至少一个交互对端设备之后,上述方法还包括:接收来自上述至少一个交互对端设备中任意一个或多个交互对端设备的用于回应上述第一语音信息的第二语音信息;将上述第二语音信息发送给上述交互本端设备;以及将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点。
可选地,在将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点之后,上述方法还包括:控制上述交互本端设备将与上述当前对话相关的语音信息发送给上述一个或多个交互对端设备;以及/或者控制上述交互本端设备接收来自上述一个或多个交互对端设备的与当前对话相关的语音信息。
可选地,上述第一语音信息是第一用户通过上述交互本端设备输入的,将接收到的上述第一语音信息发送给至少一个交互对端设备包括:根据上述第一语音信息,确定与上述第一用户进行语音交互的第二用户;确定上述第二用户在上述预设区域内的位置信息;确定上述至少一个交互对端设备中设置在与上述位置信息关联的位置上的一个或者多个交互对端设备;以及将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备。
可选地,在将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备之后,上述方法还包括:检测上述第二用户在上述预设区域内的位置信息是否发生变化;若发生变化,则确定上述至少一个交互对端设备中设置在与变化后的位置信息关联的位置上的另外一个或者多个交互对端设备;以及在再次接收到来自上述交互本端设备的用于在上述预设区域内通信时使用的语音信息后,将该语音信息发送给上述另外一个或者多个交互对端设备。
可选地,在将接收到的上述第一语音信息发送给至少一个交互对端设备之前,上述方法还包括:判断上述第一语音信息是否已被指定为发送给设置在上述预设区域内的至少一个目标交互对端设备;若是,则将上述第一语音信息发送给上述至少一个目标交互对端设备;以及/或者若否,则将接收到的上述第一语音信息发送给上述至少一个交互对端设备。
本公开的另一个方面提供了一种语音交互系统,包括:第一接收模块,用于接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及第一发送模块,用于将接收到的上述第一语音信息发送给至少一个交互对端设备。
可选地,上述系统还包括:第二接收模块,用于在将接收到的上述第一语音信息发送给至少一个交互对端设备之后,接收来自上述至少一个交互对端设备中任意一个或多个交互对端设备的用于回应上述第一语音信息的第二语音信息;第二发送模块,用于将上述第二语音信息发送给上述交互本端设备;以及设置模块,用于将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点。
可选地,上述系统还包括:第一控制模块,用于在将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点之后,控制上述交互本端设备将与上述当前对话相关的语音信息发送给上述一个或多个交互对端设备;以及/或者第二控制模块,用于控制上述交互本端设备接收来自上述一个或多个交互对端设备的与当前对话相关的语音信息。
可选地,上述第一语音信息是第一用户通过上述交互本端设备输入的,上述第一发送模块包括:第一确定单元,用于根据上述第一语音信息,确定与上述第一用户进行语音交互的第二用户;第二确定单元,用于确定上述第二用户在上述预设区域内的位置信息;第三确定单元,用于确定上述至少一个交互对端设备中设置在与上述位置信息关联的位置上的一个或者多个交互对端设备;以及发送单元,用于将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备。
可选地,上述系统还包括:检测模块,用于在将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备之后,检测上述第二用户在上述预设区域内的位置信息是否发生变化;确定模块,用于在发生变化的情况下,确定上述至少一个交互对端设备中设置在与变化后的位置信息关联的位置上的另外一个或者多个交互对端设备;以及第三发送模块,用于在再次接收到来自上述交互本端设备的用于在上述预设区域内通信时使用的语音信息后,将该语音信息发送给上述另外一个或者多个交互对端设备。
可选地,上述系统还包括:判断模块,用于在将接收到的上述第一语音信息发送给至少一个交互对端设备之前,判断上述第一语音信息是否已被指定为发送给设置在上述预设区域内的至少一个目标交互对端设备;第四发送模块,用于在是的情况下,将上述第一语音信息发送给上述至少一个目标交互对端设备;以及/或者第五发送模块,用于在否的情况下,将接收到的上述第一语音信息发送给上述至少一个交互对端设备。
本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上上述的方法。
本公开的另一方面提供了一种处理器,上述处理器用于执行计算机可执行指令,上述指令在被执行时用于实现如上上述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1A示意性示出了根据本公开的实施例的语音交互方法及系统的应用场景;
图1B示意性示出了根据本公开的另一实施例的语音交互方法及系统的应用场景;
图2示意性示出了根据本公开的实施例的语音交互方法的流程图;
图3示意性示出了根据本公开的实施例的语音交互系统的框图;以及
图4示意性示出了根据本公开的另一实施例的语音交互系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开的实施例提供了一种语音交互方法。该方法包括语音信息识别过程和语音信息下发过程。在语音信息识别过程中,语音中转端接收来自交互本端设备的第一用户输入的语音信息,并识别该语音信息是否是用于内部沟通的,若是,则进入语音信息下发过程。在语音信息下发过程中,语音中转端可以将上述语音信息发送给至少一个交互对端设备。
图1A示意性示出了根据本公开的实施例的语音交互方法及系统的应用场景。
如图1A所示,该应用场景涉及的语音设备至少包括两部分,一部分是一个或者多个独立摆放的语音输入/播放设备(以下简称为语音交互设备,包括交互本端设备和交互对端设备,其中,图中示出了语音交互设备101、语音交互设备102和语音交互设备103),另一部分是一个和计算机主机连接的语音集中处理模块(以下简称为语音中转模块104a)。
在该应用场景中,计算机主机用于进行语音识别和语义分析。该语音设备可以用于家庭、办公室、商场等的内部沟通。使用时,可以根据实际需要将不同的语音交互设备设置在预设区域内的不同位置上。以用于家庭内部沟通为例,可以在每个房间放置一个语音交互设备,这些语音交互设备根据信号强弱相互连接,并和语音中转模块104a组成一个整体网络。例如,语音交互设备101、语音交互设备102和语音交互设备103分别设置在二楼卧室、一楼客厅和一楼书房中。
本应用场景利用大多数家庭都会有的电脑设计一套语音交互设备,由电脑(即计算机主机)实现语音识别和语义分析,可以让不同房间的人利用这套语音交互设备进行通话。
图1B示意性示出了根据本公开的另一实施例的语音交互方法及系统的应用场景。
如图1B所示,该应用场景涉及的语音设备至少包括两部分,一部分是一个或者多个独立摆放的语音输入/播放设备(以下简称为语音交互设备,包括交互本端设备和交互对端设备,其中,图中示出了语音交互设备101、语音交互设备102和语音交互设备103),另一部分是一个通过路由器连接的云服务器104b。
在该应用场景中,云服务器104b用于进行语音识别和语义分析。该语音设备可以用于家庭、办公室、商场等的内部沟通。使用时,可以根据实际需要将语音交互设备设备在预设区域内的不同位置上。以用于家庭内部沟通为例,可以在每个房间放置一个语音交互设备,这些语音交互设备根据信号强弱相互连接,并通过路由器与云服务器104b组成一个整体网络。例如,语音交互设备101、语音交互设备102和语音交互设备103分别设置在二楼卧室、一楼客厅和一楼书房中。
本应用场景利用路由器将语音交互设备和云服务器104b关联,云端服务器104b实现语音识别和语义分析,也可以让不同房间的人利用这套语音交互设备进行通话。
需要说明的是,在图1B所示的应用场景中,可以使其中某个“语音交互设备”连接路由器,而其它“语音交互设备”通过该“语音交互设备”和云服务器104b进行语音交互。在图1B所示的应用场景中,也可以将每个语音交互设备独立通过路由器连接到云服务器104b上。
与图1A所示的应用场景相比,图1B所示的应用场景可以扩展语音传输的距离。
图2示意性示出了根据本公开的实施例的语音交互方法的流程图。如图2所示,该方法包括操作S201~S202,其中:
在操作S201,接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息。
在操作S202,将接收到的第一语音信息发送给至少一个交互对端设备。
需要说明的是,使用中,交互本端设备和至少一个交互对端设备可以根据实际需要安装在预设区域内的不同位置上,以便于不同用户之间交互。如图1A和图1B所示,设置在二楼卧室中的语音交互设备101可以交互本端设备,设置在一楼客厅的语音交互设备102和设置在一楼书房中的语音交互设备103都可以作为交互对端设备。
另外,在本公开实施例中,操作S201~S202可以由如图1A中的计算机和图1B中的云服务器执行。以图1A所示的应用场景为例,各语音交互设备之间,以及各语音交互设备与计算机之间都可以通过无线方式的传输信息。
具体地,第一用户通过交互本端设备输入第一语音信息后,交互本端设备将该语音信息发送给计算机主机(或者云服务器),计算机主机(或者云服务器)接收该语音信息,并通过语音识别和语义分析判断该语音信息是否是用于在预设区域(如家庭)内通信的语音信息,若是,则将接收到的第一语音信息发送给至少一个交互对端设备以广播给其他用户。
与相关技术相比,本公开实施例利用计算机本身的计算能力,不需要额外设置对讲系统,不仅省去了布线的麻烦,而且成本低。
下面结合具体实施例对图2所示的方法做进一步说明。
可选地,在将接收到的第一语音信息发送给至少一个交互对端设备之后,上述方法还包括:接收来自至少一个交互对端设备中任意一个或多个交互对端设备的用于回应第一语音信息的第二语音信息;将第二语音信息发送给交互本端设备;以及将交互本端设备和一个或多个交互对端设备设置为参与当前对话的端点。
例如,如图1A所示,当在二楼卧室的父亲要问一下在一楼书房写作业的儿子作业完成了没有时,可以通过以下步骤实现交互:
父亲:“Tony,作业做完了吗?”
这段语音会通过语音交互设备101传递到个人计算机PC,PC通过语音识别和语义分析,得知这是一个家庭内部对讲的场景,此时PC可以将这段语音发送到该家庭内的所有语音交互设备上,如语音交互设备102和语音交互设备103上。
需要说明的是,也可以在语音交互设备上内置相应的传感器(或者摄像装置)以探测各房间中是否有人。这样,PC在得知当前是一个家庭内部对讲的场景后,可以将语音仅发送给房间有人的语音交互设备上,以提高用户的体验度。
通过上述方式,儿子Tony从语音交互设备103上听到了父亲的问话并作出如下反应:
儿子:“还没有,daddy。”
这段语音会通过语音交互设备103传递给PC,PC通过语音识别和语义分析,得知这是对刚才二楼卧室中的语音交互设备101发送的语音信息的回应,此时PC会将儿子的回应发送给语音交互设备101以告知在二楼卧室内的Daddy。
同时,PC的语音识别系统还能区分不同的说话对象(如儿子和父亲),将正确的说话对象放到对话中去。具体地,PC的语音识别系统可以记录这一对语音交互设备(即语音交互设备101和语音交互设备103),将它们放到一个对话场景中,后面的对话就只发生在这两个设备之间,不再需要广播到所有语音交互设备,也不需要PC中转相关信息。
通过本公开实施例,由于计算机具有较强的语音识别和语义分析能力,因此可以做到精准将说话对象放到一个对话中,从而不像传统对讲机(或对讲系统)那样需要广播。
可选地,在将交互本端设备和一个或多个交互对端设备设置为参与当前对话的端点之后,上述方法还包括:控制交互本端设备将与当前对话相关的语音信息发送给一个或多个交互对端设备;以及/或者控制交互本端设备接收来自一个或多个交互对端设备的与当前对话相关的语音信息。
例如,如图1A所示,在父亲说了“Tony,作业做完了吗”,且儿子回复“还没有,daddy”之后,PC将父亲使用的语音交互设备101和儿子使用的语音交互设备103放入一个对话中,之后,如果父亲接着说“Tony,先休息一下吧”,儿子接着回复“好的,daddy”,此时语音交互设备101会直接将“Tony,先休息一下吧”发送给语音交互设备103,语音交互设备103也会直接将“好的,daddy”发送给语音交互设备101,而不再通过PC中转。
通过本公开实施例,将对话内容相关的交互对端设备设置在一个对话中实现直接对话,从而省去了PC的中转,因而一方面可以减轻PC的负担,另一方面可以减少传输延迟。
可选地,第一语音信息是第一用户通过交互本端设备输入的,将接收到的第一语音信息发送给至少一个交互对端设备包括:根据第一语音信息,确定与第一用户进行语音交互的第二用户;确定第二用户在预设区域内的位置信息;确定至少一个交互对端设备中设置在与位置信息关联的位置上的一个或者多个交互对端设备;以及将接收到的第一语音信息发送给一个或者多个交互对端设备。
例如,如图1A所示,在父亲在二楼卧室说了“Tony,作业做完了吗”,PC接收语音交互设备101传来的语音信息“Tony,作业做完了吗”,通过分析发现,父亲的交互对象是儿子Tony,儿子应该在一楼书房,此时,PC不再将“Tony,作业做完了吗”广播给所有的其他语音交互设备(如语音交互设备102),而是仅仅将其发送给语音交互设备103。
通过本公开实施例,由于计算机具有较强的语音识别和语义分析能力,并且计算机可以预先存储各语音交互设备的地址,因而可以精准的将语音信息发送给相应的语音交互设备,而无需全发,一方面可以减少对其他语音交互设备的无效使用,另一方面可以尽量缩小对话范围以防干扰其他家庭成员。
可选地,在将接收到的第一语音信息发送给一个或者多个交互对端设备之后,上述方法还包括:检测第二用户在预设区域内的位置信息是否发生变化;若发生变化,则确定至少一个交互对端设备中设置在与变化后的位置信息关联的位置上的另外一个或者多个交互对端设备;以及在再次接收到来自交互本端设备的用于在预设区域内通信时使用的语音信息后,将该语音信息发送给另外一个或者多个交互对端设备。
例如,如图1A所示,PC接收语音交互设备101传来的语音信息“Tony,作业做完了吗”,并将其传输给语音交互设备103之后,可以实时检测Tony的位置。如果Tony从一楼书房来到一楼客厅,则PC会将父亲之后的讲话内容发送给语音交互设备102,而不是发送给语音交互设备103。而如果Tony从一楼书房来到一楼客厅和一楼书房之间,则PC会将父亲之后的讲话内容发送给语音交互设备102和语音交互设备103。
通过本公开实施例,可以及时发现对话双方是否变更了位置,从而可以避免他们遗漏彼此的信息。
可选地,在将接收到的第一语音信息发送给至少一个交互对端设备之前,上述方法还包括:判断第一语音信息是否已被指定为发送给设置在预设区域内的至少一个目标交互对端设备;若是,则将第一语音信息发送给至少一个目标交互对端设备;以及/或者若否,则将接收到的第一语音信息发送给至少一个交互对端设备。
换言之,在本公开实施例中,用户可以通过关键字指定和哪个房间说话,比如“接通书房”,“书房”等等。如果用户通过关键字指定了房间,就不需要发送给所有房间了,只发送给指定的房间中设置的交互对端设备就可以了。
图3示意性示出了根据本公开的实施例的语音交互系统的框图。如图3所示,语音交互系统包括:第一接收模块310和第一发送模块320。第一接收模块310用于接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及第一发送模块320用于将接收到的上述第一语音信息发送给至少一个交互对端设备。语音交互系统可以执行上面参考图2所描述的方法及其对应的其他实施方式所描述的方法,以实现同一区域的内部成员之间的通信。
需要说明的是,使用中,交互本端设备和至少一个交互对端设备可以根据实际需要安装在预设区域内的不同位置上,以便于不同用户之间交互。如图1A和图1B所示,设置在二楼卧室中的语音交互设备101可以交互本端设备,设置在一楼客厅的语音交互设备102和设置在一楼书房中的语音交互设备103都可以作为交互对端设备。
另外,在本公开实施例中,操作S201~S202可以由如图1A中的计算机和图1B中的云服务器执行。以图1A所示的应用场景为例,各语音交互设备之间,以及各语音交互设备与计算机之间都可以通过无线方式的传输信息。
具体地,第一用户通过交互本端设备输入第一语音信息后,交互本端设备将该语音信息发送给计算机主机(或者云服务器),计算机主机(或者云服务器)接收该语音信息,并通过语音识别和语义分析判断该语音信息是否是用于在预设区域(如家庭)内通信的语音信息,若是,则将接收到的第一语音信息发送给至少一个交互对端设备以广播给其他用户。
与相关技术相比,本公开实施例利用计算机本身的计算能力,不需要额外设置对讲系统,不仅省去了布线的麻烦,而且成本低。
可选地,上述系统还包括:第二接收模块,用于在将接收到的上述第一语音信息发送给至少一个交互对端设备之后,接收来自上述至少一个交互对端设备中任意一个或多个交互对端设备的用于回应上述第一语音信息的第二语音信息;第二发送模块,用于将上述第二语音信息发送给上述交互本端设备;以及设置模块,用于将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点。
可选地,上述系统还包括:第一控制模块,用于在将上述交互本端设备和上述一个或多个交互对端设备设置为参与当前对话的端点之后,控制上述交互本端设备将与上述当前对话相关的语音信息发送给上述一个或多个交互对端设备;以及/或者第二控制模块,用于控制上述交互本端设备接收来自上述一个或多个交互对端设备的与当前对话相关的语音信息。
可选地,上述第一语音信息是第一用户通过上述交互本端设备输入的,上述第一发送模块包括:第一确定单元,用于根据上述第一语音信息,确定与上述第一用户进行语音交互的第二用户;第二确定单元,用于确定上述第二用户在上述预设区域内的位置信息;第三确定单元,用于确定上述至少一个交互对端设备中设置在与上述位置信息关联的位置上的一个或者多个交互对端设备;以及发送单元,用于将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备。
可选地,上述系统还包括:检测模块,用于在将接收到的上述第一语音信息发送给上述一个或者多个交互对端设备之后,检测上述第二用户在上述预设区域内的位置信息是否发生变化;确定模块,用于在发生变化的情况下,确定上述至少一个交互对端设备中设置在与变化后的位置信息关联的位置上的另外一个或者多个交互对端设备;以及第三发送模块,用于在再次接收到来自上述交互本端设备的用于在上述预设区域内通信时使用的语音信息后,将该语音信息发送给上述另外一个或者多个交互对端设备。
可选地,上述系统还包括:判断模块,用于在将接收到的上述第一语音信息发送给至少一个交互对端设备之前,判断上述第一语音信息是否已被指定为发送给设置在上述预设区域内的至少一个目标交互对端设备;第四发送模块,用于在是的情况下,将上述第一语音信息发送给上述至少一个目标交互对端设备;以及/或者第五发送模块,用于在否的情况下,将接收到的上述第一语音信息发送给上述至少一个交互对端设备。
根据本公开的实施例,装置部分实施例中各实施方式中的模块/单元、子单元与方法部分实施例中各实施方式中的操作/步骤在具体实现方法、所实现的功能、所达到的技术效果和所解决的技术问题等方面相同或类似,可以参见上面参考图2所示的实施例及其对应的其它实施方式的描述,这里不再重复。
可以理解的是,第一接收模块310和第一发送模块320可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一接收模块310和第一发送模块320中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一接收模块310和第一发送模块320中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图4示意性示出了根据本公开的另一实施例的语音交互系统的框图。如图4所示,该语音交互系统包括处理器410、计算机可读存储介质420。该语音交互系统可以执行上面参考图2描述的方法及其对应的其他实施方式所描述的方法,以实现同一区域的内部成员之间的通信。
具体地,处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行参考图2描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元,以及与图2描述的方法对应的其他实施方式所描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质420,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质420可以包括计算机程序421,该计算机程序421可以包括代码/计算机可执行指令,其在由处理器410执行时使得处理器410执行例如上面结合图2所描述的方法流程及其任何变形,以及与图2描述的方法对应的其他实施方式所描述的根据本公开实施例的方法流程及其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括一个或多个程序模块,例如包括421A、模块421B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行例如上面结合图2所描述的方法流程及其任何变形,以及与图2描述的方法对应的其他实施方式所描述的根据本公开实施例的方法流程及其任何变形。
根据本公开的实施例,第一接收模块310和第一发送模块320中的至少一个可以实现为参考图4描述的计算机程序模块,其在被处理器410执行时,可以实现上面描述的相应操作。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (10)
1.一种语音交互方法,包括:
接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及
将接收到的所述第一语音信息发送给至少一个交互对端设备。
2.根据权利要求1所述的方法,其中,在将接收到的所述第一语音信息发送给至少一个交互对端设备之后,所述方法还包括:
接收来自所述至少一个交互对端设备中任意一个或多个交互对端设备的用于回应所述第一语音信息的第二语音信息;
将所述第二语音信息发送给所述交互本端设备;以及
将所述交互本端设备和所述一个或多个交互对端设备设置为参与当前对话的端点。
3.根据权利要求2所述的方法,其中,在将所述交互本端设备和所述一个或多个交互对端设备设置为参与当前对话的端点之后,所述方法还包括:
控制所述交互本端设备将与所述当前对话相关的语音信息发送给所述一个或多个交互对端设备;以及/或者
控制所述交互本端设备接收来自所述一个或多个交互对端设备的与当前对话相关的语音信息。
4.根据权利要求1所述的方法,其中,所述第一语音信息是第一用户通过所述交互本端设备输入的,将接收到的所述第一语音信息发送给至少一个交互对端设备包括:
根据所述第一语音信息,确定与所述第一用户进行语音交互的第二用户;
确定所述第二用户在所述预设区域内的位置信息;
确定所述至少一个交互对端设备中设置在与所述位置信息关联的位置上的一个或者多个交互对端设备;以及
将接收到的所述第一语音信息发送给所述一个或者多个交互对端设备。
5.根据权利要求4所述的方法,其中,在将接收到的所述第一语音信息发送给所述一个或者多个交互对端设备之后,所述方法还包括:
检测所述第二用户在所述预设区域内的位置信息是否发生变化;
若发生变化,则确定所述至少一个交互对端设备中设置在与变化后的位置信息关联的位置上的另外一个或者多个交互对端设备;以及
在再次接收到来自所述交互本端设备的用于在所述预设区域内通信时使用的语音信息后,将该语音信息发送给所述另外一个或者多个交互对端设备。
6.根据权利要求1所述的方法,其中,在将接收到的所述第一语音信息发送给至少一个交互对端设备之前,所述方法还包括:
判断所述第一语音信息是否已被指定为发送给设置在所述预设区域内的至少一个目标交互对端设备;
若是,则将所述第一语音信息发送给所述至少一个目标交互对端设备;以及/或者
若否,则将接收到的所述第一语音信息发送给所述至少一个交互对端设备。
7.一种语音交互系统,包括:
第一接收模块,用于接收来自交互本端设备的用于在预设区域内通信时使用的第一语音信息;以及
第一发送模块,用于将接收到的所述第一语音信息发送给至少一个交互对端设备。
8.根据权利要求7所述的系统,其中,所述系统还包括:
第二接收模块,用于在将接收到的所述第一语音信息发送给至少一个交互对端设备之后,接收来自所述至少一个交互对端设备中任意一个或多个交互对端设备的用于回应所述第一语音信息的第二语音信息;
第二发送模块,用于将所述第二语音信息发送给所述交互本端设备;以及
设置模块,用于将所述交互本端设备和所述一个或多个交互对端设备设置为参与当前对话的端点。
9.根据权利要求8所述的系统,其中,所述系统还包括:
第一控制模块,用于在将所述交互本端设备和所述一个或多个交互对端设备设置为参与当前对话的端点之后,控制所述交互本端设备将与所述当前对话相关的语音信息发送给所述一个或多个交互对端设备;以及/或者
第二控制模块,用于控制所述交互本端设备接收来自所述一个或多个交互对端设备的与当前对话相关的语音信息。
10.根据权利要求7所述的系统,其中,所述第一语音信息是第一用户通过所述交互本端设备输入的,所述第一发送模块包括:
第一确定单元,用于根据所述第一语音信息,确定与所述第一用户进行语音交互的第二用户;
第二确定单元,用于确定所述第二用户在所述预设区域内的位置信息;
第三确定单元,用于确定所述至少一个交互对端设备中设置在与所述位置信息关联的位置上的一个或者多个交互对端设备;以及
发送单元,用于将接收到的所述第一语音信息发送给所述一个或者多个交互对端设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710205165.6A CN107026943B (zh) | 2017-03-30 | 2017-03-30 | 语音交互方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710205165.6A CN107026943B (zh) | 2017-03-30 | 2017-03-30 | 语音交互方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107026943A true CN107026943A (zh) | 2017-08-08 |
CN107026943B CN107026943B (zh) | 2020-04-24 |
Family
ID=59526345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710205165.6A Active CN107026943B (zh) | 2017-03-30 | 2017-03-30 | 语音交互方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107026943B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108322852A (zh) * | 2018-01-30 | 2018-07-24 | 上海思愚智能科技有限公司 | 一种智能音箱的语音播放方法、装置及存储介质 |
CN109917753A (zh) * | 2019-04-18 | 2019-06-21 | 中船第九设计研究院工程有限公司 | 一种基于可穿戴语音交互设备的人机协同作业系统 |
CN111104088A (zh) * | 2018-10-25 | 2020-05-05 | 阿里巴巴集团控股有限公司 | 一种通过语音设备播报信息的方法及系统 |
CN111416758A (zh) * | 2020-03-27 | 2020-07-14 | 海信集团有限公司 | 智慧家居实时对讲系统及方法 |
CN111667820A (zh) * | 2020-06-22 | 2020-09-15 | 京东方科技集团股份有限公司 | 通信方法、装置、电子设备和计算机可读存储介质 |
CN113448251A (zh) * | 2020-03-24 | 2021-09-28 | 海信集团有限公司 | 位置提示方法及系统 |
WO2021190225A1 (zh) * | 2020-03-27 | 2021-09-30 | 华为技术有限公司 | 一种语音交互方法及电子设备 |
CN113596809A (zh) * | 2021-07-30 | 2021-11-02 | 思必驰科技股份有限公司 | 基于自然语言编码的设备发现方法及系统 |
CN113724702A (zh) * | 2020-05-25 | 2021-11-30 | 阿里巴巴集团控股有限公司 | 一种实现信息处理的架构、方法及装置和智能音箱及服务端 |
CN113765753A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家电设备的即时通信方法、家电设备及存储介质 |
CN113765756A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家庭终端的通信方法、终端及存储介质 |
CN113765755A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家庭终端的通信方法、终端及存储介质 |
CN114514756A (zh) * | 2019-07-30 | 2022-05-17 | 杜比实验室特许公司 | 音频设备的协调 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080137816A1 (en) * | 2004-04-13 | 2008-06-12 | Young-Sik Shin | System And Method For Visitor Reception Service In Absence |
CN104581444A (zh) * | 2015-01-08 | 2015-04-29 | 上海伟视清数字技术有限公司 | 一种楼宇对讲系统 |
-
2017
- 2017-03-30 CN CN201710205165.6A patent/CN107026943B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080137816A1 (en) * | 2004-04-13 | 2008-06-12 | Young-Sik Shin | System And Method For Visitor Reception Service In Absence |
CN104581444A (zh) * | 2015-01-08 | 2015-04-29 | 上海伟视清数字技术有限公司 | 一种楼宇对讲系统 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108322852A (zh) * | 2018-01-30 | 2018-07-24 | 上海思愚智能科技有限公司 | 一种智能音箱的语音播放方法、装置及存储介质 |
CN108322852B (zh) * | 2018-01-30 | 2020-06-05 | 重庆与展微电子有限公司 | 一种智能音箱的语音播放方法、装置及存储介质 |
CN111104088A (zh) * | 2018-10-25 | 2020-05-05 | 阿里巴巴集团控股有限公司 | 一种通过语音设备播报信息的方法及系统 |
CN111104088B (zh) * | 2018-10-25 | 2023-10-03 | 阿里巴巴集团控股有限公司 | 一种通过语音设备播报信息的方法及系统 |
CN109917753A (zh) * | 2019-04-18 | 2019-06-21 | 中船第九设计研究院工程有限公司 | 一种基于可穿戴语音交互设备的人机协同作业系统 |
CN114514756A (zh) * | 2019-07-30 | 2022-05-17 | 杜比实验室特许公司 | 音频设备的协调 |
CN113448251A (zh) * | 2020-03-24 | 2021-09-28 | 海信集团有限公司 | 位置提示方法及系统 |
CN111416758A (zh) * | 2020-03-27 | 2020-07-14 | 海信集团有限公司 | 智慧家居实时对讲系统及方法 |
WO2021190225A1 (zh) * | 2020-03-27 | 2021-09-30 | 华为技术有限公司 | 一种语音交互方法及电子设备 |
CN113724702A (zh) * | 2020-05-25 | 2021-11-30 | 阿里巴巴集团控股有限公司 | 一种实现信息处理的架构、方法及装置和智能音箱及服务端 |
CN113765755A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家庭终端的通信方法、终端及存储介质 |
CN113765756A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家庭终端的通信方法、终端及存储介质 |
CN113765753A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 家电设备的即时通信方法、家电设备及存储介质 |
CN113765753B (zh) * | 2020-06-02 | 2023-04-25 | 云米互联科技(广东)有限公司 | 家电设备的即时通信方法、家电设备及存储介质 |
CN111667820A (zh) * | 2020-06-22 | 2020-09-15 | 京东方科技集团股份有限公司 | 通信方法、装置、电子设备和计算机可读存储介质 |
CN113596809A (zh) * | 2021-07-30 | 2021-11-02 | 思必驰科技股份有限公司 | 基于自然语言编码的设备发现方法及系统 |
CN113596809B (zh) * | 2021-07-30 | 2023-10-13 | 思必驰科技股份有限公司 | 基于自然语言编码的设备发现方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107026943B (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107026943A (zh) | 语音交互方法及系统 | |
JP6947852B2 (ja) | 複数のコンピューティングデバイスを使用したインターホン式の通信 | |
US9774998B1 (en) | Automatic content transfer | |
EP3580750A1 (en) | Method and apparatus for managing voice-based interaction in internet of things network system | |
EP3633947B1 (en) | Electronic device and control method therefor | |
US11031008B2 (en) | Terminal device and method for controlling thereof | |
CN106030699A (zh) | 多个设备上的热词检测 | |
CN105393302A (zh) | 多级语音识别 | |
CN104285428A (zh) | 用于运行通信服务的方法和系统 | |
CN108269567A (zh) | 用于生成远场语音数据的方法、装置、计算设备以及计算机可读存储介质 | |
US9020109B2 (en) | Location aware conferencing system and method | |
WO2018212470A1 (ko) | 음성요청에 대응하는 정보 제공을 위한 미디어 선택 | |
US20190074991A1 (en) | Outputting audio based on user location | |
KR20200074690A (ko) | 전자 장치 및 이의 제어 방법 | |
CN111385175A (zh) | 本地化虚拟个人助理 | |
CN107612798A (zh) | 呼叫门铃的方法、装置和系统 | |
US9042563B1 (en) | System and method to localize sound and provide real-time world coordinates with communication | |
WO2016198132A1 (en) | Communication system, audio server, and method for operating a communication system | |
CN106790171A (zh) | 会话控制的方法、装置和计算机可读存储介质 | |
US10810973B2 (en) | Information processing device and information processing method | |
CN106920301A (zh) | 二维码自识别导引系统 | |
CN107783650A (zh) | 一种基于虚拟机器人的人机交互方法及装置 | |
JP2020178317A (ja) | インターホンシステム、設定方法、及びプログラム | |
US20210225381A1 (en) | Information processing device, information processing method, and program | |
CN110675856A (zh) | 用于呼叫中心的人机对话方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |