CN108257598B - 交互控制方法、装置、服务器系统及存储介质 - Google Patents

交互控制方法、装置、服务器系统及存储介质 Download PDF

Info

Publication number
CN108257598B
CN108257598B CN201810026585.2A CN201810026585A CN108257598B CN 108257598 B CN108257598 B CN 108257598B CN 201810026585 A CN201810026585 A CN 201810026585A CN 108257598 B CN108257598 B CN 108257598B
Authority
CN
China
Prior art keywords
voice
user
interaction
establishment request
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810026585.2A
Other languages
English (en)
Other versions
CN108257598A (zh
Inventor
常哲珲
黄开粤
高铭瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN201810026585.2A priority Critical patent/CN108257598B/zh
Publication of CN108257598A publication Critical patent/CN108257598A/zh
Application granted granted Critical
Publication of CN108257598B publication Critical patent/CN108257598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种基于语音设备的交互控制方法、装置、服务器系统及存储介质,该方法通过接收用户通过语音设备发出的语音交互场景的建立请求,然后判断建立请求是否符合服务器中的各类语音交互场景任一预置的交互规则,当用户的建立请求符合其中之一交互规则时,将预设时间段内发出同一建立请求的用户接入并分配至与所述建立请求匹配的语音交互场景,使得用户可以通过用户语音快速与其他用户进入与其建立请求匹配的语音交互场景,不需要通过交互界面与其他用户进行交互,大大提高了交互效率和交互乐趣。

Description

交互控制方法、装置、服务器系统及存储介质
技术领域
本发明实施例涉及交互控制技术领域,尤其涉及一种基于语音设备的交互控制方法、装置、服务器系统及存储介质。
背景技术
现有的用户在进行“狼人杀”、“杀人游戏”、“真心话大冒险”等网络交互类游戏时,往往需要一个用户充当“法官类”裁判角色,有时候“法官类”裁判角色并不受用户欢迎,这影响了用户进行该类交互游戏的用户体验。
或者,用户在进行该类交互游戏时,还需要通过终端上的交互界面来与其他用户进行交互,这种通过交互界面与其他用户进行交互的方式减低了交互效率与交互乐趣。
或者,现有的远程电话会议时,不同地区的参会者需要通过拨号进入电话会议系统,拨号方式加入会议系统这一交互方式也不够高效,其有些电话会议需要有会议主持人主持,这也变相增加了电话会议成本。
发明内容
本发明提供一种基于语音设备的交互控制方法、装置、服务器系统及存储介质,以解决用户在进行网络交互类场景时,需要用户充当裁判类角色或者需要通过交互界面与其他用户进行交互的问题。
第一方面,本发明实施例提供了一种基于语音设备的交互控制方法,包括:
接收用户通过语音设备发出的语音交互场景的建立请求;
判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
第二方面,本发明实施例还提供了一种基于语音设备的交互控制装置,包括:
建立请求接收模块,用于接收用户通过语音设备发出的语音交互场景的建立请求;
判断模块,用于判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接入模块,用于接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
第三方面,本发明实施例还提供了一种服务器系统,所述服务器系统包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
语音设备,用于根据用户的操作发出语音交互场景的建立请求;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的交互控制方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述交互控制方法。
本发明实施例提供的一种基于语音设备的交互控制方法,通过接收用户通过语音设备发出的语音交互场景的建立请求,然后判断建立请求是否符合服务器中的各类语音交互场景任一预置的交互规则,当用户的建立请求符合其中之一交互规则时,将预设时间段内发出同一建立请求的用户接入并分配至与所述建立请求匹配的语音交互场景,使得用户可以通过用户语音快速与其他用户进入与其建立请求匹配的语音交互场景,不需要通过交互界面与其他用户进行交互,大大提高了交互效率和交互乐趣。
附图说明
图1为本发明实施例一提供的一种基于语音设备的交互控制方法的流程图;
图2是一种实现本实施例方法的分布式配置的语音设备和服务器系统架构;
图3是本发明实施例方法的第一种应用场景示意图;
图4是本发明实施例方法的第二种应用场景示意图;
图5是本发明实施例方法的第三种应用场景示意图;
图6是本发明实施例方法的第四种应用场景示意图;
图7是本发明实施例二提供的一种基于语音设备的交互控制方法的流程图;
图8是本发明实施例方法的第五种应用场景示意图;
图9是本发明实施例三提供的一种基于语音设备的交互控制装置的结构框图;
图10为本发明实施例四提供的一种服务器系统的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种基于语音设备的交互控制方法的流程图,本实施例的方法具体可用于用户通过语音设备进行网络交互类场景的情况,该方法可以由交互控制装置来执行,该装置可独立的配置在语音设备或者服务器中,也可分布式配置在语音设备和服务器中,两者配合实现本实施例的方法。
本发明实施例以图2示出的一种实现本实施例方法的分布式配置的语音设备和服务器系统架构为例具体说明,本实施例的方法可以具体包括如下步骤:
步骤101、接收用户通过语音设备发出的语音交互场景的建立请求。
具体的,语音设备可以为智能音箱、智能语音可穿戴设备、智能手机等具有语音识别功能的电子设备,“语音交互场景”可以是用户所希望在服务器中建立的一个相对独立的虚拟空间,例如用户利用图2示出的系统架构进行狼人杀游戏时,该“语音交互场景”可以是“狼人杀游戏空间”;用户进行电话会议时,该“语音交互场景”可以是“会议空间”;用户进行“远程头脑风暴讨论”时,该“语音交互场景”可以是“讨论空间”,服务器中可以为这些不同的语音交互场景分配不同的服务器区,同一个服务器区针对一项语音交互场景,或者服务器还可以为这些不同的语音交互场景分配不同的分服务器,每个分服务器针对一项语音交互场景。
在本发明实施例中,用户如果希望通过图2示出的系统架构在服务器中建立“语音交互场景”,可以通过语音设备向服务器发出语音交互场景的建立请求,服务器接收该建立请求,例如对智能音箱说:“帮我建立一个8人的狼人杀游戏空间”,对智能音箱说:“帮我建立一个10人头脑风暴讨论空间”等等,则本发明实施例的语音设备接收用户发出的用户语音后,可以根据用户语音发出语音交互场景的建立请求,服务器接收这一建立请求,即可以接收用户通过语音设备发出的语音交互场景的建立请求。
在本发明的一种优选实施例中,步骤101可以包括如下子步骤:
子步骤S11、通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求。
具体的,语音设备的个数可以为一个,也可以为多个(两个或两个以上),当语音设备的个数为一个时,则本发明实施例基于图2架构可以实现如图3示出的本发明实施例方法的第一种应用场景,图3示出的场景中,每个用户都在语音设备的附近(例如用户团坐在语音设备四周的情况),语音设备能够接收到每个用户发出的语音交互场景的建立请求对应的用户语音,在此情况下,用户已经发出了建立请求对应的用户语音,此时语音设备可以接收该用户语音并识别用户语音,并基于识别用户语音生成建立请求,服务器则接收该建立请求,此处需要说明的是,语音设备识别用户语音的过程不仅包括利用现有的语音识别技术对用户语音进行识别理解的过程,即理解用户说的内容,还包括利用“说话人识别技术”根据用户语音音色区分出每个用户的不同身份。
当语音设备的个数为多个时,则本发明实施例基于图2的架构可以实现图4示出的本发明实施例方法的第二种应用场景,图4示意的场景中,多个语音设备互相通信,多个语音设备组件成一个语音设备群,每个用户都在语音设备群的附近,对于每个用户发出的用户语音,语音设备群中每一个语音设备都可以接收并识别,通过多个语音设备的识别,提高语音识别的准确率以及“说话人识别技术”区分每个用户不同身份的准确率。
当语音设备的个数为多个时,本发明实施例基于图2的架构还可以实现图5示出的本发明实施例方法的第三种应用场景,图5示意的场景中,多个语音设备互相通信,一个或多个用户分布在不同的地点,同一地点的用户向该地点的一个或多个语音设备发送用户语音。
当语音设备的个数为多个时,本发明实施例基于图2的架构还可以实现图6示出的本发明实施例方法的第四种应用场景,图6示意的场景中,多个语音设备互相通信,每个用户分布在不同的地点,每个用户对应一个语音设备,且每个语音设备都具有唯一的设备标识,当用户在利用语音设备进行语音交互场景时,通过与其对应的语音设备发出建立请求。
步骤102、判断所述建立请求是否符合所述语音交互场景预置的交互规则。
具体的,“预置的交互规则”可以是本领域技术人员根据实际设置的“交互规则”,其作用是用来判断用户发出的建立请求是否符合该交互规则,针对不同的语音交互场景,本领域技术人员可以设置不同的交互规则,例如,对于“狼人杀游戏”的语音交互场景,该交互规则可以为建立请求中出现“狼人杀”、“人数不小于5”和“游戏空间”,符合该交互规则的建立请求为建立请求对应的用户语音中兼具“狼人杀”、“人数不小于5”和“游戏空间”这三者的内容,否则用户发出的建立请求不符合该交互规则;对于“头脑风暴”的语音交互场景,该交互规则可以为建立请求中出现“头脑风暴”、“人数不小于3”和“讨论空间”,符合该交互规则的建立请求为建立请求对应的用户语音中兼具“头脑风暴”、“人数不小于3”和“讨论空间”这三者的内容,否则用户发出的建立请求不符合该交互规则,当然此处列举仅作为一种示例,本领域技术人员可以根据实际情况自行设计交互规则。
在本发明实施例中,利用图2示意的架构图,“预置的交互规则”可以保存在服务器相应的数据库中,服务器中可以保存多个语音交互场景预置的交互规则,当服务器接收用户通过语音设备发出的语音交互场景的建立请求后,可以判断该建立请求是否符合服务器中任意一个语音交互场景预置的交互规则。
步骤103、接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
具体的,“预设时间段”可以从第一个用户发出的建立请求符合预置的交互规则开始计时并根据本领域技术人员设置的时间间隔来获取的时间段,例如服务器在判断出第一个用户发出的建立请求符合预置的交互规则时为11时30分15秒,开始计时,设置的时间间隔为30s,则预设时间段为“11时30分15秒-11时30分45秒”,当然,预设时间段不限于此,本领域技术人员还可以直接人为将系统的时间划分为多个连续的“预设时间段”,本发明实施例在此不多作限制。
“同一建立请求”则是用户所希望建立的语音交互场景的内容完全一致的建立请求,例如用户A发出的建立请求为“帮我建立一个8人的狼人杀游戏空间”,用户B发出的建立请求为“帮我建立一个8人的狼人杀游戏空间”,或者B发出的建立请求为“建立一个8人的狼人杀游戏空间”,由于A和B的建立请求完全一致或者表达的含义一致,可以认为用户A与B的建立请求为同一建立请求。相反,用户A发出的建立请求为“帮我建立一个8人的狼人杀游戏空间”,用户B发出的建立请求为“帮我建立一个10人的狼人杀游戏空间”,由于A和B的建立请求包含的人数要求不一致,用户A与B的建立请求为不同建立请求。
因此,在本发明实施例中,当用户的建立请求符合服务器中任意一个语音交互场景预置的交互规则,可以将在预设时间内发出同一建立请求的用户接入并分配至与所述建立请求匹配的语音交互场景,在服务器中为这些用户分配一个相对独立的虚拟空间,作为这些用户进行语音交互的语音交互场景,用户在该场景下进行语音交互。
相应地,当用户的建立请求都不符合服务器中的语音交互场景预置的交互规则时,表明用户的建立请求有瑕疵或者错误,则可以向用户反馈建立请求错误的提醒,提示用户更正建立请求。
本发明实施例提供的一种基于语音设备的交互控制方法,通过语音设备接收用户通过语音设备发出的语音交互场景的建立请求,然后判断建立请求是否符合服务器中的各类语音交互场景任一预置的交互规则,当用户的建立请求符合其中之一交互规则时,将预设时间段内发出同一建立请求的用户接入并分配至与所述建立请求匹配的语音交互场景,使得用户可以通过用户语音快速与其他用户进入与其建立请求匹配的语音交互场景,不需要通过交互界面与其他用户进行交互,大大提高了交互效率和交互乐趣。
实施例二
图7为本发明实施例二提供的一种基于语音设备的交互控制方法的流程图,本实施例二是在实施例一基础上的改进,并是在图3或图4或图5或图6示出的场景下的交互控制方法,相同之处可以参照实施例一,本实施例在此略作省略。
本发明实施例的方法可以包括如下步骤:
步骤201、接收用户通过语音设备发出的语音交互场景的建立请求。
在本发明实施例中,步骤201可以参照步骤101,但与步骤101不同的是,步骤201还可以包括如下子步骤S21。
子步骤S21、通过所述语音设备接收用户通过所述终端生成的语音交互场景的建立请求,并发出所述建立请求。
在本发明实施例中,语音设备与用户所持有的终端连接,终端具有唯一的终端标识,相应地,在图3或图4或图5或图6示意的场景下,其中的语音设备与用户持有的终端连接,例如,在图6示意的场景的基础上,本实施例的方法还可以应用于图8示出的本发明实施例方法的第五种应用场景,在图8示意的场景中,用户所持有的终端与语音设备连接,即用户所持有的终端可以与语音设备进行通信,用户可以通过终端发出语音交互场景的建立请求,例如用户可以通过终端上安装的APP设置语音交互场景人数,语音交互场景类型等参数,并将包含这些参数的建立请求发送至语音设备,即语音设备接收到了用户通过终端生成的语音交互场景的建立请求,然后将该建立请求发送至服务器,服务器接收到该建立请求,此处需要说明的是,终端上安装的APP并不同于现有的狼人杀游戏APP,头脑风暴APP等,终端上安装的APP其作用是对建立请求进行设置并发送,并不包含狼人杀游戏、头脑风暴内容,因此该安装的APP小巧轻便,方便用户使用,减少用户终端负荷。
需要说明的是,在图3或图4或图5的基础上所衍生出的场景,本发明实施例在此便不作列举,其示意与图8类似。
步骤202、判断所述建立请求是否符合所述语音交互场景预置的交互规则。
步骤203、接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
步骤204、根据所述用户语音为所述用户分配用户代称。
在本发明实施例中,如前文步骤101中的子步骤S11所述,语音设备识别用户语音的过程不仅包括利用现有的语音识别技术对用户语音进行识别理解的过程,即理解用户说的内容,还包括利用“说话人识别技术”根据用户语音区分出每个用户的不同身份,因此服务器可以通过用户语音知晓每个用户的的身份,即可以根据用户语音为每个用户分配用户代称,具体的,用户代称是本发明实施例的方法用来区分用户的符号,在不同的语音交互场景下可以设置不同的分配代称方法,例如在狼人杀交互场景中,服务器可以根据用户接入语音交互场景的顺序依次编号,或者还可以随机分配武侠小说人物,杨过、郭靖、小龙女等,在头脑风暴交互场景中,则可以在服务器中预先设置每个参与讨论者的真实姓名作为代称,当服务器根据用户语音识别出其姓名时,直接分配其真实姓名作为其代称,当然上述方法仅作为一种示例,本发明实施例对此不作限制。
需要说明的是,该步骤204的方法对应于与图3或图4或图5示意的场景。相应地,对应于图6示意的场景,本发明实施例的方法还可以包括步骤205。
步骤205、根据所述用户语音和/或所述设备标识为所述用户分配用户代称。
具体的,对应于图6示意的场景,由于每个用户都一一对应于一语音设备,该语音设备还具有唯一的设备标识,其中设备标识可以为语音设备的硬件码、其可以是语音设备制造厂商出厂时设置的,当然该设备标识还可以是用户自行设置的,本发明实施例不作限制。
因此,可以根据设备标识为用户分配用户代称,具体的代称分配方法可以参照步骤204,本发明实施例在此不作赘述。
步骤206、根据所述终端标识为所述用户分配用户代称。
步骤206的方法应用于图8示意的场景,在该场景下,由于每一语音设备都与用户持有的终端连接,终端具有唯一的终端标识,其中终端标识可以为终端设备的硬件码、其可以是终端制造厂商出厂时设置的,当然该终端标识还可以是用户自行设置的,本发明实施例不作限制。
在本发明实施例中,由于是通过语音设备接收用户通过所述终端生成的语音交互场景的建立请求,因此,可以根据终端标识为所述用户分配用户代称。
可以理解的是,上述步骤204-206是针对不同的场景,其不一定是必需的,本领域技术人员可以根据不同的应用场景具体选择,且步骤204或205或206也不一定要求在步骤203之后,在步骤201之后也是可行的,本发明实施例对步骤204或205或206的顺序不作限制,只要不发生冲突,都是可行的。
步骤207、通过所述语音设备向每一用户发送其所对应的用户代称及其成功接入的消息;
在本发明实施例中,当服务器为用户分配用户代称后,可以通过语音设备告知每一用户其所对应的用户代称及其成功接入语音交互场景在服务器对应的服务器区的消息,以便让用户知悉其已进入语音交互场景,以便让用户及时作出反应。
例如,在狼人杀交互场景中,当为8个用户分配代称1-8后,可以告知每个用户其被分配的代称,并告知每个用户(例如代称为2的用户)其已接入狼人杀服务器区。
步骤208、当接收到所有用户确认交互开始的指示后,进入交互状态。
在本发明实施例中,当用户收到接入的消息后,可以发出确认交互开始的指示,当语音设备收到所有用户确认交互开始的指示后,可以通知服务器中的语音交互场景进入交互状态,每一用户发出的用户语音经过语音设备的接收和处理,广播发送至其他用户,服务器按照该语音交互场景预置的交互规则控制整个交互过程,使得整个语音交互场景下的交互过程井然有序,提高了交互效率和用户交互的乐趣。
例如,在进行狼人杀语音交互场景下,服务器按照狼人杀的交互规则,发挥法官角色的作用,指挥控制着整个交互场景的有序进行,使得用户在进行狼人杀语音交互时,不需要用户担任法官角色,提高交互体验,再如,在进行某一具有特定交互规则会议的交互场景下,服务器按照该会议的交互规则发挥会议主持人的作用,提升会议的智能化程度,并降低会议成本。
需要说明的是,在本发明实施例中,在进入交互状态后,服务器除了会按照交互场景预置的规则控制整个交互过程,还会监控整个交互场景应用在服务器所耗费的资源情况,以及所有交互场景下的每个交互场景的用户人数等信息,以便服务器针对每个交互场景下的服务器负载情况进行调整。
步骤209、在交互状态过程中,当用户处于语音禁令阶段时,所述用户发出的用户语音不被所述语音设备接收或降低其所发出用户语音对应的声音大小。
在本发明实施例中,当交互状态的过程中,根据每个特定语音交互场景交互的不同,有些语音交互场景下,按照其特定的交互规则,当某一用户正在发言时,其他用户是不允许插嘴说话的,例如狼人杀交互场景下,当被杀者发表死后遗言时,其他参与者禁止说话,为了应对这一情形,当用户处于语音禁令阶段时(即其处于禁止说话时),该用户对语音设备发出的用户语音不被语音设备接收,或者即使语音设备接收该用户语音,但语音设备广播发送至其他用户时,降低该用户语音对应的声音大小,以减少该处于语音禁令阶段的用户的用户语音对其他用户的干扰,提高用户的交互体验。
实施例三
图9为本发明实施例三提供的一种基于语音设备的交互控制装置的结构框图,该交互控制装置可以包括:
建立请求接收模块301,用于接收用户通过语音设备发出的语音交互场景的建立请求;
判断模块302,用于判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接入模块303,用于接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
在本发明的一种优选实施例中,所述语音设备的个数为一个或多个,当所述语音设备的个数为多个时,所述多个语音设备互相通信;
所述建立请求接收模块具体包括:
第一语音识别子模块,用于通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制装置还包括:
第一用户代称分配子模块,用于根据所述用户语音为所述用户分配用户代称。
在本发明的一种优选实施例中,所述语音设备的个数为多个,所述语音设备与所述用户一一对应并具有唯一的设备标识;所述多个语音设备互相通信;
所述建立请求接收模块具体包括:
第二语音识别子模块,用于通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制装置还包括:
第二用户代称分配子模块,用于根据所述用户语音和/或所述设备标识为所述用户分配用户代称。
在本发明的一种优选实施例中,所述语音设备与用户所持有的终端连接,所述终端具有唯一的终端标识;
所述建立请求接收模块具体还包括:
建立请求发出子模块,用于通过所述语音设备接收用户通过所述终端生成的语音交互场景的建立请求,并发出所述建立请求;
所述交互控制装置还包括:
第三用户代称分配子模块,根据所述终端标识为所述用户分配用户代称。
在本发明的一种优选实施例中,所述交互控制装置还包括:
通知模块,用于通过所述语音设备向每一用户发送其所对应的用户代称及其成功接入的消息;
交互状态进入模块,用于当接收到所有用户确认交互开始的指示后,进入交互状态。
在本发明的一种优选实施例中,所述交互控制装置还包括:
声音控制模块,用于在交互状态过程中,当用户处于语音禁令阶段时,所述用户发出的用户语音不被所述语音设备接收或降低其所发出用户语音对应的声音大小。
本发明实施例所提供的交互控制装置可执行本发明任意实施例所提供的交互控制方法,具备执行方法相应的功能模块和有益效果。
实施例四
图10为本发明实施例四提供的一种服务器系统的结构示意图,如图10所示,该服务器系统包括处理器40、存储器41、输入装置42、输出装置43和语音设备44;服务器系统中处理器40的数量可以是一个或多个,图10中以一个处理器40为例;服务器系统中的处理器40、存储器41、输入装置42、输出装置43和语音设备44可以通过总线或其他方式连接,图10中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的交互控制方法对应的程序指令/模块(例如,交互控制装置中的建立请求接收模块301、判断模块302和接入模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行服务器系统的各种功能应用以及数据处理,即实现上述的交互控制方法。
语音设备44可以为智能音箱、智能语音可穿戴设备、智能手机等具有语音识别功能的电子设备,用于根据用户的操作发出语音交互场景的建立请求,即当用户通过用户语音与语音设备交互时,语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;当用户通过其所持有的终端与语音设备交互时,语音设备接收用户通过所述终端生成的语音交互场景的建立请求,并发出所述建立请求;具体可以参照实施例一和实施例二的相关描述,本发明实施例在此不作赘述。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据服务器系统的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至服务器系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与服务器系统的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种交互控制方法,该方法包括:
接收用户通过语音设备发出的语音交互场景的建立请求;
判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的交互控制方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述交互控制装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种基于语音设备的交互控制方法,其特征在于,包括:
接收用户通过语音设备发出的语音交互场景的建立请求;
判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景;
其中,所述语音设备的个数为一个或多个,当所述语音设备的个数为多个时,所述多个语音设备互相通信;
接收用户通过语音设备发出的语音交互场景的建立请求,具体包括:
通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制方法还包括:
根据所述用户语音为所述用户分配用户代称。
2.根据权利要求1所述的交互控制方法,其特征在于,所述语音设备的个数为多个,所述语音设备与所述用户一一对应并具有唯一的设备标识;所述多个语音设备互相通信;
接收用户通过语音设备发出的语音交互场景的建立请求,具体包括:
通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制方法还包括:
根据所述用户语音和/或所述设备标识为所述用户分配用户代称。
3.根据权利要求1或2所述的交互控制方法,其特征在于,所述语音设备与用户所持有的终端连接,所述终端具有唯一的终端标识;
接收用户通过语音设备发出的语音交互场景的建立请求,具体还包括:
通过所述语音设备接收用户通过所述终端生成的语音交互场景的建立请求,并发出所述建立请求;
所述交互控制方法还包括:
根据所述终端标识为所述用户分配用户代称。
4.根据权利要求1或2所述的交互控制方法,其特征在于,所述交互控制方法还包括:
通过所述语音设备向每一用户发送其所对应的用户代称及其成功接入的消息;
当接收到所有用户确认交互开始的指示后,进入交互状态。
5.根据权利要求4所述的交互控制方法,其特征在于,所述交互控制方法还包括:
在交互状态过程中,当用户处于语音禁令阶段时,所述用户发出的用户语音不被所述语音设备接收或降低其所发出用户语音对应的声音大小。
6.一种基于语音设备的交互控制装置,其特征在于,包括:
建立请求接收模块,用于接收用户通过语音设备发出的语音交互场景的建立请求;
判断模块,用于判断所述建立请求是否符合所述语音交互场景预置的交互规则;
接入模块,用于接收在预设时间段内发出符合所述交互规则的同一建立请求的用户接入并将其分配至与所述建立请求匹配的语音交互场景;
其中,所述语音设备的个数为一个或多个,当所述语音设备的个数为多个时,所述多个语音设备互相通信;
所述建立请求接收模块具体包括:
第一语音识别子模块,用于通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制装置还包括:
第一用户代称分配子模块,用于根据所述用户语音为所述用户分配用户代称。
7.根据权利要求6所述的交互控制装置,其特征在于,所述语音设备的个数为多个,所述语音设备与所述用户一一对应并具有唯一的设备标识;所述多个语音设备互相通信;
所述建立请求接收模块具体包括:
第二语音识别子模块,用于通过所述语音设备接收并识别用户语音,基于所述用户语音生成所述建立请求;
所述交互控制装置还包括:
第二用户代称分配子模块,用于根据所述用户语音和/或所述设备标识为所述用户分配用户代称。
8.一种服务器系统,其特征在于,所述服务器系统包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
语音设备,用于根据用户的操作发出语音交互场景的建立请求;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的交互控制方法。
9.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5中任一所述的交互控制方法。
CN201810026585.2A 2018-01-11 2018-01-11 交互控制方法、装置、服务器系统及存储介质 Active CN108257598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810026585.2A CN108257598B (zh) 2018-01-11 2018-01-11 交互控制方法、装置、服务器系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810026585.2A CN108257598B (zh) 2018-01-11 2018-01-11 交互控制方法、装置、服务器系统及存储介质

Publications (2)

Publication Number Publication Date
CN108257598A CN108257598A (zh) 2018-07-06
CN108257598B true CN108257598B (zh) 2021-03-16

Family

ID=62726025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810026585.2A Active CN108257598B (zh) 2018-01-11 2018-01-11 交互控制方法、装置、服务器系统及存储介质

Country Status (1)

Country Link
CN (1) CN108257598B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200184984Y1 (ko) * 1999-11-13 2000-06-15 주식회사이데전자 인터넷 컴퓨터 게임방 음성채팅 주장비에 연결되는 단말기
US8175638B2 (en) * 2007-05-02 2012-05-08 Demand Media, Inc. Virtual video message answering machine platform
CN103023913A (zh) * 2012-12-26 2013-04-03 腾讯科技(深圳)有限公司 一种语音通信的建立方法、装置和系统
CN103347003A (zh) * 2013-06-19 2013-10-09 腾讯科技(深圳)有限公司 一种语音互联方法、装置及系统
US9331858B2 (en) * 2011-05-03 2016-05-03 Sony Computer Entertainment Inc. Persistent party rooms
CN106961385A (zh) * 2017-03-15 2017-07-18 腾讯科技(深圳)有限公司 虚拟场景交互中实时语音的实现方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188620A (zh) * 2006-11-17 2008-05-28 张立伟 利用flash插件技术创建互联网虚拟会客厅在一个界面同时实现同步异步交流
CN101316301A (zh) * 2008-07-15 2008-12-03 杨海晨 网络游戏中提供实时、可靠的多人语音交互的系统和方法
JP5385026B2 (ja) * 2009-06-26 2014-01-08 株式会社コナミデジタルエンタテインメント ゲームシステム及びゲームコンティニュー状態設定方法
US8894484B2 (en) * 2012-01-30 2014-11-25 Microsoft Corporation Multiplayer game invitation system
CN103391283B (zh) * 2013-06-27 2015-04-01 腾讯科技(深圳)有限公司 一种游戏接入方法、游戏处理方法及服务器、终端、系统
US10058777B2 (en) * 2013-11-21 2018-08-28 Tencent Technology (Shenzhen) Company Limited Task execution method, apparatus and system
CN104702696B (zh) * 2015-03-23 2018-08-28 北京合生共济投资咨询有限责任公司 一种跨平台即时数据交互方法、装置以及系统
CN106156243A (zh) * 2015-04-26 2016-11-23 上海灵域网络科技有限公司 一种社交娱乐方法及系统
CN104992137B (zh) * 2015-08-03 2018-07-13 福州最美影视网络科技有限公司 一种在线互动方法及系统
CN106975220B (zh) * 2016-01-15 2020-09-04 阿里巴巴(中国)有限公司 游戏用户与房间匹配方法及系统
CN107329725A (zh) * 2016-04-28 2017-11-07 上海连尚网络科技有限公司 用于控制多人交互应用的方法与设备
CN107395376A (zh) * 2017-08-04 2017-11-24 天脉聚源(北京)科技有限公司 一种虚拟房间的操作方法及装置
CN107450957B (zh) * 2017-08-09 2020-10-27 网易(杭州)网络有限公司 游戏配置的处理方法、装置、存储介质、处理器及终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200184984Y1 (ko) * 1999-11-13 2000-06-15 주식회사이데전자 인터넷 컴퓨터 게임방 음성채팅 주장비에 연결되는 단말기
US8175638B2 (en) * 2007-05-02 2012-05-08 Demand Media, Inc. Virtual video message answering machine platform
US9331858B2 (en) * 2011-05-03 2016-05-03 Sony Computer Entertainment Inc. Persistent party rooms
CN103023913A (zh) * 2012-12-26 2013-04-03 腾讯科技(深圳)有限公司 一种语音通信的建立方法、装置和系统
CN103347003A (zh) * 2013-06-19 2013-10-09 腾讯科技(深圳)有限公司 一种语音互联方法、装置及系统
CN106961385A (zh) * 2017-03-15 2017-07-18 腾讯科技(深圳)有限公司 虚拟场景交互中实时语音的实现方法和装置

Also Published As

Publication number Publication date
CN108257598A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN108920937A (zh) 投屏系统、投屏方法和装置
US10165327B2 (en) Video studio creating method and service device
US9292500B2 (en) Virtual participant-based real-time translation and transcription system for audio and video teleconferences
CN104320680B (zh) 一种视频直播管理方法、开启方法、相关设备及系统
EP3049949B1 (en) Acoustic feedback control for conference calls
US9236048B2 (en) Method and device for voice controlling
CN104038410A (zh) 一种群组成员身份信息保护方法及系统
WO2017172651A1 (en) Selecting an autonomous software agent
CN102893573A (zh) 一种预约会议的方法及系统
JP2015536618A (ja) 会議へのアクセス方法及び装置
CN111258530B (zh) 音频播放控制方法和服务器以及音频播放系统
CN108257598B (zh) 交互控制方法、装置、服务器系统及存储介质
CN111681650A (zh) 一种智能会议控制方法和装置
CN113596381A (zh) 一种音频数据的采集方法及装置
KR101665256B1 (ko) 비가청 주파수와 패턴을 이용한 출석체크 방법 및 시스템
CN111436028B (zh) 一种业务接入方法、系统及通信开放平台
CN111355919B (zh) 一种通信会话控制方法及装置
CN109412931B (zh) 利用即时通讯方式进行知识问答的方法、装置和终端设备
CN113628632A (zh) 语音降噪方法、装置、设备及存储介质
CN113132673A (zh) 一种实现视联网会议的方法及装置
CN114500916A (zh) 会议管理方法、装置、设备及介质
CN115914466B (zh) 一种基于语音流机器人的语音交互方法及装置、存储介质
KR102560419B1 (ko) 릴레이 방식으로 음성을 공유하는 동시통역 부스 제어 장치 및 방법
CN112615876B (zh) 在会议中直播的方法和装置
KR102655041B1 (ko) 음성을 공유하는 온라인 통역 부스 제어 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190219

Address after: 100085 East District, Second Floor, 33 Xiaoying West Road, Haidian District, Beijing

Applicant after: BEIJING KINGSOFT INTERNET SECURITY SOFTWARE Co.,Ltd.

Address before: 511400 Tian'an Science and Technology Industrial Building, Panyu Energy-saving Science Park, 555 North Panyu Avenue, Donghuan Street, Panyu District, Guangzhou City, Guangdong Province

Applicant before: GUANGZHOU LANBO INTELLIGENT TECHNOLOGY CO.,LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant