CN112742024B - 虚拟对象的控制方法、装置、设备及存储介质 - Google Patents

虚拟对象的控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112742024B
CN112742024B CN202010843355.2A CN202010843355A CN112742024B CN 112742024 B CN112742024 B CN 112742024B CN 202010843355 A CN202010843355 A CN 202010843355A CN 112742024 B CN112742024 B CN 112742024B
Authority
CN
China
Prior art keywords
virtual object
voice control
voice
target
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010843355.2A
Other languages
English (en)
Other versions
CN112742024A (zh
Inventor
张明远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010843355.2A priority Critical patent/CN112742024B/zh
Publication of CN112742024A publication Critical patent/CN112742024A/zh
Application granted granted Critical
Publication of CN112742024B publication Critical patent/CN112742024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/40Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment
    • A63F13/42Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle
    • A63F13/424Processing input control signals of video game devices, e.g. signals generated by the player or derived from the environment by mapping the input signals into game commands, e.g. mapping the displacement of a stylus on a touch screen to the steering angle of a virtual vehicle involving acoustic input signals, e.g. by using the results of pitch or rhythm extraction or voice recognition
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/20Input arrangements for video game devices
    • A63F13/21Input arrangements for video game devices characterised by their sensors, purposes or types
    • A63F13/215Input arrangements for video game devices characterised by their sensors, purposes or types comprising means for detecting acoustic signals, e.g. using a microphone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本申请公开了虚拟对象的控制方法、装置、设备及存储介质。方法包括:获取针对虚拟对象的语音控制信号;确定虚拟对象对应的第一目标智能化等级,获取第一目标智能化等级对应的第一语音控制词集合,第一目标智能化等级用于指示虚拟对象的智能化程度;将语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配;响应于至少一个关键词中存在匹配成功的关键词,控制虚拟对象对匹配成功的关键词指示的目标控制信息进行响应。基于上述过程,根据玩家的语音控制信号即可实现对虚拟对象的控制,虚拟对象的控制过程的实现无需玩家执行复杂操作,人机交互的便捷性较高,有利于提高虚拟对象的控制效果,提升玩家的游戏体验。

Description

虚拟对象的控制方法、装置、设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种虚拟对象的控制方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,游戏的种类越来越多,功能越来越丰富。在目前的游戏中,终端基于玩家使用实体按键或者触摸按键产生的控制指令对虚拟对象进行控制,在此种方式中,虚拟对象的控制过程的实现需要玩家执行较复杂的操作,人机交互的便捷性较差,虚拟对象的控制效果不佳。
发明内容
本申请实施例提供了一种虚拟对象的控制方法、装置、设备及存储介质,可用于提高虚拟对象的控制效果。所述技术方案如下:
一方面,本申请实施例提供了一种虚拟对象的控制方法,所述方法包括:
获取针对虚拟对象的语音控制信号;
确定所述虚拟对象对应的第一目标智能化等级,获取所述第一目标智能化等级对应的第一语音控制词集合,所述第一目标智能化等级用于指示所述虚拟对象的智能化程度;所述第一目标智能化等级为智能化等级集合中的智能化等级;对于所述智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量;
将所述语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配;
响应于所述至少一个关键词中存在匹配成功的关键词,控制所述虚拟对象对目标控制信息进行响应,所述目标控制信息为匹配成功的关键词指示的控制信息。
另一方面,提供了一种虚拟对象的控制装置,所述装置包括:
获取模块,用于获取针对虚拟对象的语音控制信号;
确定模块,用于确定所述虚拟对象对应的第一目标智能化等级;
所述获取模块,还用于获取所述第一目标智能化等级对应的第一语音控制词集合,所述第一目标智能化等级用于指示所述虚拟对象的智能化程度;所述第一目标智能化等级为智能化等级集合中的智能化等级;对于所述智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量;
匹配模块,用于将所述语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配;
控制模块,用于响应于所述至少一个关键词中存在匹配成功的关键词,控制所述虚拟对象对目标控制信息进行响应,所述目标控制信息为匹配成功的关键词指示的控制信息。
在一种可能实现方式中,所述控制模块,用于确定所述第一目标智能化等级对应的目标响应速度;控制所述虚拟对象按照所述目标响应速度对所述目标控制信息进行响应。
在一种可能实现方式中,所述获取模块,还用于响应于所述虚拟对象具有语音交互功能且所述语音控制信号对应的语音控制文本包括语音交互文本,获取与所述语音交互文本对应的语音应答文本;
所述控制模块,还用于控制所述虚拟对象对所述语音应答文本进行语音播报。
在一种可能实现方式中,所述获取模块,还用于获取所述语音控制信号对应的语音控制文本;
所述装置还包括:
处理模块,用于对所述语音控制文本进行词划分处理,得到所述语音控制文本对应的至少一个基础词;
所述获取模块,还用于对于所述至少一个基础词中的任一基础词,获取所述任一基础词对应的分类结果,响应于所述任一基础词对应的分类结果满足参考条件,将所述任一基础词作为所述语音控制信号对应的关键词。
在一种可能实现方式中,所述装置还包括:
显示模块,用于执行以下至少一种显示方式:
在所述虚拟对象所处的显示页面中的第一位置处显示第一提示信息,所述第一提示信息用于对所述虚拟对象对应的第一目标智能化等级进行提示;
在所述虚拟对象所处的显示页面中的第二位置处显示第二提示信息,所述第二提示信息用于对所述第一语音控制词集合进行提示。
在一种可能实现方式中,所述获取模块,还用于响应于所述虚拟对象对应的智能化等级由第一目标智能化等级更新为第二目标智能化等级,获取所述第二目标智能化等级对应的第二语音控制词集合;
所述控制模块,还用于基于所述第二语音控制词集合实现对所述虚拟对象的控制。
在一种可能实现方式中,所述获取模块,还用于获取所述第二语音控制词集合与所述第一语音控制词集合之间的差异词集合;
所述显示模块,还用于在所述虚拟对象所处的显示页面中的第三位置处显示第三提示信息,所述第三提示信息用于对所述差异词集合进行提示。
在一种可能实现方式中,所述目标控制信息包括操作指令信息,所述控制模块,用于控制所述虚拟对象执行所述操作指令信息指示的动作;或者,控制所述虚拟对象执行所述操作指令信息指示的动作,且控制所述虚拟对象播报与所述操作指令信息匹配的内容。
在一种可能实现方式中,所述目标控制信息包括情绪信息,所述控制模块,用于控制所述虚拟对象播报与所述情绪信息匹配的内容。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一所述的虚拟对象的控制方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一所述的虚拟对象的控制方法。
另一方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的虚拟对象的控制方法。
本申请实施例提供的技术方案至少带来如下有益效果:
在本申请实施例中,虚拟对象对应有智能化等级,智能化等级对应有语音控制词集合,在此基础上,根据玩家的语音控制信号即可实现对虚拟对象的控制,虚拟对象的控制过程的实现无需玩家执行复杂操作,人机交互的便捷性较高,有利于提高虚拟对象的控制效果,提升玩家的游戏体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种虚拟对象的控制方法的实施环境的示意图;
图2是本申请实施例提供的一种虚拟对象的控制方法的流程图;
图3是本申请实施例提供的一种获取语音控制信号对应的语音控制文本的过程示意图;
图4是本申请实施例提供的一种虚拟对象所处的显示页面的示意图;
图5是本申请实施例提供的一种终端对虚拟对象的控制过程的示意图;
图6是本申请实施例提供的一种虚拟对象的控制装置的示意图;
图7是本申请实施例提供的一种虚拟对象的控制装置的示意图;
图8是本申请实施例提供的一种终端的结构示意图;
图9是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
为了便于理解本申请实施例的技术过程,下面对本申请实施例所涉及的一些名词进行解释:
虚拟场景:是应用程序在终端上运行时显示(或提供)的虚拟场景。该虚拟场景可以是对真实世界的仿真场景,也可以是半仿真半虚构的虚拟场景,还可以是纯虚构的虚拟场景。虚拟场景可以是二维虚拟场景、2.5维虚拟场景和三维虚拟场景中的任意一种,本申请对此不加以限定。例如,虚拟场景可以包括天空、陆地、海洋等,该陆地可以包括沙漠、城市等环境元素,交互对象(玩家用户)可以控制虚拟对象在该虚拟场景中进行移动。
虚拟对象:是指在虚拟场景中的可活动对象。该可活动对象可以是虚拟人物、虚拟动物、动漫人物等。例如,虚拟对象为在虚拟场景中显示的人物、动物、植物、油桶、墙壁、石块等。虚拟对象可以是虚拟场景中的一个虚拟的用于代表用户的虚拟形象。虚拟场景中可以包括多个虚拟对象,每个虚拟对象在虚拟场景中具有自身的形状和体积,占据虚拟场景中的一部分空间。示例性地,虚拟角色可以是通过在应用程序上操作进行控制的角色,也可以是通过训练设置在虚拟场景对战中的人工智能角色,还可以是设置在虚拟场景对战中的非玩家角色。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方法涉及人工智能技术中的语音处理技术。语音处理技术的关键技术有自动语音识别技术(Automatic Speech Recognition,ASR)和语音合成技术(Text To Speech,TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供了一种虚拟对象的控制方法,请参考图1,其示出了本申请实施例提供的虚拟对象的控制方法的实施环境的示意图。该实施环境包括:终端11和服务器12。
终端11安装和运行有支持虚拟场景的应用程序。该应用程序可以是虚拟现实应用程序、三维地图程序、第一人称射击游戏(First-Person Shooting Game,FPS)、多人在线战术竞技游戏(Multiplayer Online Battle Arena Games,MOBA)、多人枪战类生存游戏中的任意一种。终端11是交互对象使用的终端,交互对象使用终端11操作位于虚拟场景中的虚拟对象进行活动,该活动包括但不限于:调整身体姿态、爬行、步行、奔跑、骑行、跳跃、驾驶、拾取、射击、攻击、投掷中的至少一种。在本申请实施例中,终端11能够基于交互对象的语音控制信号实现对虚拟对象的控制。
服务器12用于为支持虚拟场景的应用程序提供后台服务。在一种可能实现方式中,服务器12承担主要计算工作,终端11承担次要计算工作;或者,服务器12担次要计算工作,终端11承担主要计算工作;或者,服务器12和终端11二者之间采用分布式计算架构进行协同计算。
在一种可能实现方式中,终端11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如PC(Personal Computer,个人计算机)、手机、智能手机、PDA(Personal Digital Assistant,个人数字助手)、可穿戴设备、掌上电脑PPC(PocketPC)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
基于上述图1所示的实施环境,本申请实施例提供一种虚拟对象的控制方法,以该方法应用于终端11为例。如图2所示,本申请实施例提供的方法包括如下步骤:
在步骤201中,获取针对虚拟对象的语音控制信号。
针对虚拟对象的语音控制信号为交互对象针对虚拟对象产生的语音信号,用于供终端实现对虚拟对象的控制。本申请实施例中的虚拟对象是指虚拟场景中的一个虚拟的用于代表交互对象的虚拟形象。本申请实施例对虚拟对象的类型不加以限定,示例性地,虚拟对象为虚拟人物、虚拟动物、动漫人物等。
虚拟对象在应用程序提供的虚拟场景中进行活动,交互对象在进入该应用程序后,交互对象能够通过语音与虚拟场景中的虚拟对象进行交互,以使虚拟对象对语音进行响应。本申请实施例对支持虚拟场景的应用程序的类型不加以限定,示例性地,支持虚拟场景的应用程序可以是虚拟现实应用程序、三维地图程序、第一人称射击游戏、多人在线战术竞技游戏、多人枪战类生存游戏中的任意一种。在本申请实施例中,以支持虚拟场景的应用程序为游戏类应用程序为例进行说明。
在一种可能实现方式中,获取针对虚拟对象的语音控制信号的过程为:当游戏类应用程序中的游戏开始时,启动语音采集装置;当语音采集装置采集到交互对象的语音信号时,终端获取针对虚拟对象的语音控制信号。本申请实施例对语音采集装置的类型不加以限定,示例性地,语音采集装置为麦克风。
在一种可能实现方式中,在获取针对虚拟对象的语音控制信号后,进一步执行获取语音控制信号对应的至少一个关键词的操作,从而在获取到语音控制信号对应的至少一个关键词时,执行步骤203。在一种可能实现方式中,执行获取语音控制信号对应的至少一个关键词的操作的过程包括:获取语音控制信号对应的语音控制文本;从语音控制文本中获取语音控制信号对应的至少一个关键词。需要说明的是,获取语音控制信号对应的至少一个关键词的操作可以由终端执行,也可以由服务器执行,本申请实施例对此不加以限定,本申请实施例以获取语音控制信号对应的至少一个关键词的操作由终端执行为例进行说明。
在一种可能实现方式中,获取语音控制信号对应的语音控制文本的过程包括以下两个步骤:
步骤1:对语音控制信号进行特征提取,得到语音控制信号对应的声学特征。
语音控制信号为采集的交互对象的原始语音信号,在获取语音控制信号之后,先获取语音控制信号对应的声学特征,进而基于声学特征执行后续的语音识别过程。声学特征是指语音控制信号的标识特征。基于声学特征进行后续的语音识别,有利于提高语音识别结果的准确性。本申请实施例对声学特征的类型不加以限定,示例性地,声学特征为LPC(Linear Predictive Coding,线性预测编码)特征、MFCC(Mel Frequency CepstrumCoefficient,梅尔频率倒谱系数)特征等。
声学特征的提取是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间,称之为帧。帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对语音信号进行预加重以提升高频,对语音信号加窗以避免短时语音段边缘的影响。对语音控制信号进行分帧的过程可以基于傅里叶变换技术实现,傅里叶变换技术能够按照声音的频率对语音控制信号进行分帧。在对语音控制信号进行分帧后,提取每帧语音信号的声学特征,得到语音控制信号对应的声学特征。
步骤2:对声学特征进行语音识别处理,得到语音控制信号对应的语音控制文本。
在示例性实施例中,对声学特征进行语音识别处理,得到语音控制信号对应的语音控制文本的过程为:调用声学模型对声学特征进行处理,得到语音控制信号对应的音素信息;调用语言模型对音素信息进行处理,得到音素信息对应的词序列;将音素信息对应的词序列与词典进行对比处理,得到语音控制信号对应的语音控制文本。
声学模型训练是语音识别系统的核心部分,占据着大部分的计算开销并在很大程度上决定着系统的识别性能,利用训练声学特征及其对应的标注音素信息进行有监督的训练得到声学模型。语言模型的基本思想是对音素信息进行解码处理,得到音素信息可能对应的词序列,语言模型可以是基于N-gram的统计语言模型,语言模型也可以基于大量的训练数据训练得到。
在音素信息对应的词序列中,可能有一个或多个词对应同一个音素,将音素信息对应的词序列与词典进行比对处理,能够分析出每个音素最有可能对应的词,进而根据上下文信息得到各个词构成的语音控制文本,将该语音控制文本作为语音控制信号对应的真实文本。
示例性地,获取语音控制信号对应的语音控制文本的过程如图3所示,对语音控制信号进行特征提取,得到声学特征;将声学特征输入声学模型进行处理,得到语音控制信号对应的音素信息;将音素信息输入语言模型进行处理,得到音素信息对应的词序列;将音素信息对应的词序列与词典进行对比处理,得到语音控制信号对应的语音控制文本。
在得到语音控制信号对应的语音控制文本后,从语音控制文本中获取语音控制信号对应的至少一个关键词。在一种可能实现方式中,从语音控制文本中获取语音控制信号对应的至少一个关键词的过程为:对语音控制文本进行词划分处理,得到语音控制文本对应的至少一个基础词;对于至少一个基础词中的任一基础词,获取任一基础词对应的分类结果,响应于任一基础词对应的分类结果满足参考条件,将任一基础词作为语音控制信号对应的关键词。
在一种可能实现方式中,对语音控制文本进行词划分处理的过程为:利用分词算法对语音控制文本进行分词处理。本申请实施例对分词算法不加以限定,示例性地,分词算法是指双向最大匹配法或者最少切分法等。在一种可能实现方式中,获取任一基础词对应的分类结果的方式为:将任一基础词输入词语分类模型进行处理,得到词语分类模型输出的分类结果。词语分类模型是指根据预先训练得到的分类模型,能够确定任一基础词所属的类别。
在一种可能实现方式中,任一基础词对应的分类结果包括任一基础词所属的类别,任一基础词对应的分类结果满足参考条件是指任一基础词所属的类别为参考类别中的任一类别。需要说明的是,参考类别根据实际应用场景设置,示例性地,根据游戏场景中可能出现的词语类别进行设置,例如,参考类别包括技能使用指令类、给养补充指令类、战略部署指令类、语气情绪类等。当任一基础词对应的分类结果满足参考条件时,将该任一基础词作为语音控制信号对应的关键词。
在根据上述方式执行获取语音控制信号对应的至少一个关键词的操作的过程中,若语音控制文本中存在对应的分类结果满足参考条件的基础词,则将对应的分类结果满足参考条件的全部基础词作为语音控制信号对应的至少一个关键词,执行步骤203;若语音控制文本中不存在对应的分类结果满足参考条件的基础词,则说明语音控制文本中不存在关键词,此时说明基于此次获取的语音控制信号无法实现利用语音控制词对虚拟对象进行控制的过程。
在步骤202中,确定虚拟对象对应的第一目标智能化等级,获取第一目标智能化等级对应的第一语音控制词集合。
其中,第一目标智能化等级用于指示虚拟对象的智能化程度。第一目标智能化等级是指虚拟对象对应的智能化等级,用于指示虚拟对象当前的智能化程度。第一目标智能化等级为智能化等级集合中的智能化等级;对于智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量。
在示例性实施例中,对于游戏类应用程序中的任一虚拟对象而言,该虚拟对象对应的智能化等级可以根据该虚拟对象的历史游戏数据决定。本申请实施例对能够决定虚拟对象对应的智能化等级的历史游戏数据的类型不加以限定。示例性地,虚拟对象的历史游戏数据包括虚拟对象参与的游戏活动类型、虚拟对象获得的游戏成果、虚拟对象参与的游戏局数、虚拟对象获得的游戏经验值中的至少一个。
在本申请实施例中,为游戏中的虚拟对象均增加智能化等级设定,根据每个虚拟对象的历史游戏数据均可以确定该虚拟对象对应的智能化等级。当终端检测到交互对象登录游戏类应用程序并利用虚拟对象进行游戏时,终端确定该虚拟对象当前对应的智能化等级,将该虚拟对象当前对应的智能化等级作为第一目标智能化等级。
在示例性实施例中,终端确定某一虚拟对象当前对应的智能化等级的方式可以为:终端获取该虚拟对象的历史游戏数据;对虚拟对象的历史游戏数据进行分析处理,得到历史游戏数据对应的智能化得分;将智能化得分对应的智能化等级作为虚拟对象当前对应的智能化等级。当然,在示例性实施例中,虚拟对象当前对应的智能化等级也可以是预先获取并与虚拟对象的标识对应存储的,此种情况下,终端可以直接提取虚拟对象的标识对应的智能化等级作为该虚拟对象当前对应的智能化等级。虚拟对象的标识用于唯一标识一个虚拟对象,例如,虚拟对象的标识为虚拟对象的昵称、虚拟对象的ID(Identity Document,身份标识)号等。
需要说明的是,预先获取智能化等级的过程可以参见实时确定智能化等级的过程,此处不再赘述。在示例性实施例中,预先设置游戏数据和智能化得分的对应关系,进而基于游戏数据和智能化得分的对应关系实现对虚拟对象的历史游戏数据进行分析处理,得到历史游戏数据对应的智能化得分的过程。游戏数据和智能化得分的对应关系可以根据经验设置,也可以根据应用场景灵活调整,本申请实施例对此不加以限定。
在一种可能实现方式中,获取第一目标智能化等级对应的第一语音控制词集合的过程为:获取智能化等级和语音控制词集合的对应关系;在智能化等级和语音控制词集合的对应关系中查询第一目标智能化等级对应的第一语音控制词集合。
智能化等级和语音控制词集合的对应关系由虚拟对象对应的游戏类应用程序的开发者预先设置。在示例性实施例中,智能化等级和语音控制词集合的对应关系可以携带在游戏类应用程序的安装包中,从而在终端安装游戏类应用程序后,将智能化等级和语音控制词集合的对应关系存储在终端本地,此种情况下,终端获取智能化等级和语音控制词集合的对应关系的方式为:终端从本地提取智能化等级和语音控制词集合的对应关系。在示例性实施例中,智能化等级和语音控制词集合的对应关系还可以保存在游戏类应用程序的后台服务器中,此种情况下,终端获取智能化等级和语音控制词集合的对应关系的方式为:终端从后台服务器获取智能化等级和语音控制词集合的对应关系。
由于智能化等级和语音控制词集合的对应关系中记录了各个智能化级别分别对应的语音控制词集合,所以,在确定虚拟对象对应的第一目标智能化等级后,通过在智能化等级和语音控制词集合的对应关系中进行查询,即可得到第一目标智能化等级对应的第一语音控制词集合。
在一种可能实现方式中,智能化等级和语音控制词集合的对应关系的设置方式由游戏类应用程序的开发者自行设定,本申请实施例对此不加以限定。智能化等级和语音控制词集合的对应关系的设置基本要求为:较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量。
本申请实施例对智能化等级的表现方式不加以限定,示例性地,智能化等级利用程度表示,例如,智能化等级分为极低级、低级、中级、高级、顶级。示例性地,智能化等级利用分值表示,例如,智能化等级分为1级、2级、3级……10级。分值越高说明智能化的等级越高。示例性地,利用分值表示的智能化等级与利用程度表示的智能化等级之间存在对应关系,例如,极低级对应1级、低级对应2~4级、中级对应5~7级、高级对应8~9级、顶级对应10级。智能化等级用于标识虚拟对象的“智力”高低。
在一种可能实现方式中,在设置智能化等级和语音控制词集合的对应关系之前,先设置智能化等级集合,智能化等级集合中包括各个不同的智能化等级。也就是说,第一目标智能化等级为智能化等级集合中的智能化等级。除设置智能化等级集合外,还将游戏场景下可能出现的语音控制词分为几个类别,如,技能使用指令类、给养补充指令类、战略部署指令类、语气情绪类等。然后为每个类别设置对应的语音控制词,如,技能使用指令类对应的语音控制词包括“放箭”、“出大招”等;给养补充指令类对应的语音控制词包括“吃仙草”、“补血”等;战略部署指令类对应的语音控制词包括“撤退”、“回家”等;语气情绪类对应的语音控制词包括“快快快”、“啊啊啊”、“太气了”等。不同类别对应的语音控制词的数量可能相同,也可能不同,本申请实施例对此不加以限定。
在设置好了智能化等级集合以及不同的类别后,设置智能化等级和类别之间的对应关系,进而将某一智能化等级对应的类别对应的语音控制词的集合作为该智能化等级对应的语音控制词集合。由此,得到智能化等级和语音控制词集合的对应关系。需要说明的是,当智能化等级对应的类别为空时,该智能化等级对应的语音控制词集合为空集合。本申请实施例对智能化等级和类别之间的对应关系的设置方式不加以限定。只需满足较高的智能化等级对应的类别的数量不少于较低的智能化等级对应的类别的数量即可。
示例性地,智能化等级和语音控制词集合的对应关系可以用表格表示。例如,智能化等级和语音控制词集合的对应关系如表1所示:
表1
Figure GDA0003970501200000121
Figure GDA0003970501200000131
根据表1可知,当某一虚拟对象对应的智能化等级为1级或极低级时,由于虚拟对象的智能化程度过低(“智力”过低),虚拟对象不能响应交互对象通过语音发出的任何操作指令,也就是说,终端无法基于任何语音控制词对虚拟对象进行控制。在此种情况下,交互对象无法基于语音控制信号实现对虚拟对象的操作,只能通过按键或者触摸屏实现对虚拟对象的操作。
当某一虚拟对象对应的智能化等级为2~4级或者低级时,虚拟对象的智能化程度较低,仅能响应交互对象通过语音发出的技能使用指令。当某一虚拟对象对应的智能化等级为5~7级或者中级时,虚拟对象的智能化程度中等,虚拟对象解锁了给养补充指令,虚拟对象能够响应交互对象通过语音发出的技能使用指令和给养补充指令。当某一虚拟对象对应的智能化等级为8~9级或者高级时,虚拟对象的智能化程度较高,虚拟对象能够解锁所有的操作指令(包括技能使用指令、给养补充指令和战略部署指令)。
当虚拟对象对应的智能化等级为10级或者顶级时,虚拟对象的智能化程度极高,虚拟对象能够解锁语气情绪类词的情绪识别以及语音交互功能,此时虚拟对象除了可以响应通过语音发出的全部类型的操作指令外,还可以做简单的情绪识别,比如,当交互对象在用语音说出某一操作指令对应的语音控制词时,说出了“快快快”,则可以判断交互对象比较着急、急躁,从而优先执行该操作指令,并根据游戏场景做出语音回应。在示例性实施例中,当某一虚拟对象智能化等级为顶级时,交互对象可以使用语音完全造作该虚拟对象,从而实现终端根据语音控制信号对虚拟对象的控制。
在示例性实施例中,随着智能化等级的提高,虚拟对象能够响应的语音控制词的类别逐渐增加。当虚拟对象的智能化等级为顶级时,虚拟对象可以接受所有类别的语音类操作指令,甚至可以识别交互对象的情绪,还可以与交互对象进行语音交互。
需要说明的是,表1仅为一种智能化等级和语音控制词集合的对应关系的示例性描述,智能化等级对应的语音控制词集合中包括的语音控制词不局限于上表中示出的词。智能化等级和语音控制词集合的对应关系可以根据实际应用场景进行灵活调整。
在一种可能实现方式中,游戏类应用程序的开发者在设置智能化等级和语音控制词集合的对应关系的过程中,还可以设置智能化等级和响应速度的对应关系。本申请实施例对智能化等级和响应速度的对应关系的设置方式不加以限定,只需较高的智能化等级对应的响应速度不低于较低的智能化等级对应的响应速度即可。
在一种可能实现方式中,终端还可以执行以下至少一种显示方式:
显示方式1、在虚拟对象所处的显示页面中的第一位置处显示第一提示信息,该第一提示信息用于对虚拟对象对应的第一目标智能化等级进行提示。
虚拟对象所处的显示页面是指终端为交互对象展示的页面,在虚拟对象所处的显示页面中的第一位置处显示第一提示信息能够提示交互对象,虚拟对象当前对应怎样的智能化等级。第一位置根据经验设置,也可以根据应用场景灵活调整,本申请实施例对此不加以限定,示例性地,第一位置为虚拟对象所在位置的上方位置。在此种情况下,第一位置随着虚拟对象所在位置的移动而移动。
本申请实施例对第一提示信息的形式不加以限定,只要能够起到对虚拟对象对应的第一目标智能化等级进行提示的作用即可。示例性地,第一提示信息为第一目标智能化等级对应的等级条信息。在第一目标智能化等级对应的等级条信息中,包括但不限于等级条信息标识、第一目标智能化等级的标识以及第一目标智能化等级对应的等级条。第一目标智能化等级对应的等级条用于体现第一目标智能化等级与最高等级的智能化等级的之间的差距。等级条信息标识用于指示该等级条信息为智能化等级方面的信息,示例性地,等级条信息标识为字母Q,该字母Q即用于指示该等级条信息为智能化等级方面的信息。第一目标智能化等级的标识用于标识第一目标智能化等级,示例性地,假设第一目标智能化等级为8级,则第一目标智能化等级的标识为8。
本申请实施例对第一提示信息的显示时机和显示时长均不加以限定,示例性地,第一提示信息的显示时机为:虚拟对象开始参与游戏的时刻,或者距离虚拟对象开始参与游戏的时刻参考时长的时刻。示例性地,参考时长为2秒。示例性地,在虚拟对象参与的整个游戏中,若虚拟对象对应的智能化等级不发生改变,则一直保持显示该第一提示信息,直至虚拟对象对应的智能化等级发生改变,显示用于对改变后的智能化等级进行提示的提示信息。
显示方式2、在虚拟对象所处的显示页面中的第二位置处显示第二提示信息,该第二提示信息用于对第一语音控制词集合进行提示。
第二位置根据经验设置,也可以根据应用场景灵活调整,本申请实施例对此不加以限定,示例性地,第二位置为虚拟对象所处的显示页面中的顶部位置。在此种情况下,第二位置不随虚拟对象所在位置的移动而移动。
本申请实施例对第二提示信息的形式不加以限定,只要能够起到对第一语音控制词集合进行提示的作用即可。示例性地,第二提示信息为包括第一语音控制词集合中的全部语音控制词的信息;或者,第二提示信息为包括第一语音控制词集合中的全部语音控制词对应的全部类别的信息。
当第二提示信息为包括第一语音控制词集合中的全部语音控制词的信息时,在虚拟对象所处的显示页面中的第二位置处显示第二提示信息能够提示交互对象,终端能够基于包括哪些关键词的语音控制信号对虚拟对象进行控制;当第二提示信息为包括第一语音控制词集合中的全部语音控制词对应的全部类别的信息时,在虚拟对象所处的显示页面中的第二位置处显示第二提示信息能够提示交互对象,终端能够基于包括哪个或哪些指定类别的关键词的语音控制信号对虚拟对象进行控制。需要说明的是,当交互对象发出包括指定类别的关键词的语音控制信号时,由于语音控制信号中包括的该指定类别的关键词可能与第一语音控制词集合中的各个语音控制词均不匹配,所以终端仍有可能无法基于该指定类别的关键词实现对虚拟对象的控制。
本申请实施例对第二提示信息的显示时机和显示时长均不加以限定,示例性地,第二提示信息的显示时机为:虚拟对象开始参与游戏的时刻,或者距离虚拟对象开始参与游戏的时刻参考时长的时刻。示例性地,参考时长为2秒。需要说明的是,第二提示信息的显示时机可以与第一提示信息的显示时机相同,也可以与第一提示信息的显示时机不同,本申请实施例对此不加以显示。示例性地,第二提示信息的显示时长为指定时长(如,5秒),在显示指定时长后隐藏该第二提示信息,以避免对显示页面产生不必要的遮挡。
需要说明的是,终端可以执行上述两种显示方式中的任一种,也可以执行上述两种显示方式,本申请实施例对此不加以显示。例如,对于终端执行上述两种显示方式的情况,虚拟对象所处的显示页面如图4所示。
在图4中,在虚拟对象400所在位置的上方位置401处显示第一提示信息,该第一提示信息包括等级条信息标识Q、第一目标智能等级的标识8以及第一目标智能等级对应的等级条。需要说明的是,在图4所示的显示页面中,在虚拟对象400所在位置的上方,除显示第一提示信息外,还显示虚拟对象400的昵称(我是XX)以及虚拟对象400的体力(P)对应的等级条信息。在显示页面的顶部位置402处显示第二提示信息,该第二提示信息用于指示在对虚拟对象进行控制的过程中,支持技能使用指令类、给养补充指令类和战略部署指令类的语音控制词。
在步骤203中,将语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配。
当基于语音控制文本能够获取到语音控制信号对应的至少一个关键词时,将至少一个关键词与第一语音控制词集合进行匹配,以判断能否基于语音控制信号对应的关键词实现对虚拟对象的控制。第一语音控制词集合为虚拟对象对应的智能化等级对应的语音控制词集合。第一语音控制词集合用于指示终端能够基于哪些词对虚拟对象进行控制。第一语音控制词集合取决于虚拟对象对应的智能化等级。需要说明的是,第一语音控制词集合可能为空集合,也可能不为空集合。当第一语音控制词集合为空集合时,说明第一语音控制词集合中不包括任何语音控制词,也就说明终端无法基于任何词对虚拟对象进行控制。当第一语音控制词集合不为空集合时,第一语音控制词集合中包括至少一个语音控制词,此时说明终端能够基于与该至少一个语音控制词匹配成功的词对虚拟对象进行控制。
在一种可能实现方式中,将语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配的过程为:将语音控制信号对应的至少一个关键词中的各个关键词分别与第一语音控制词集合进行匹配,以判断各个关键词是否与第一语音控制词集合匹配成功。任一关键词与第一语音控制词集合匹配成功是指该任一关键词与第一语音控制词集合中的任一语音控制词的相似度不低于参考阈值。参考阈值根据经验设置,或者根据应用场景灵活调整,示例性地,参考阈值为95%。在示例性实施例中,参考阈值还可以设置为100%,此时,任一关键词与第一语音控制词集合匹配成功是指该任一关键词与第一语音控制词集合中的某一语音控制词完全相同。
在一种可能实现方式中,对于至少一个关键词的类别已知,且语音控制词集合中的语音控制词按照类别分组的情况,将至少一个关键词与第一语音控制词集合进行匹配的过程为:对于任一关键词,将该任一关键词与目标类别的语音控制词进行匹配,目标类别为该任一关键词的类别。
将语音控制信号对应的至少一个关键词语与第一语音控制词集合进行匹配的匹配结果包括以下两种:
匹配结果一:至少一个关键词中存在匹配成功的关键词。
在此种情况下,说明终端能够基于语音控制信号对应的关键词实现对虚拟对象的控制,此种匹配结果下,执行步骤204。
匹配结果二:至少一个关键词中不存在匹配成功的关键词。
在此种情况下,说明终端无法基于此次获取的语音控制信号对应的关键词实现对虚拟对象的控制。
在一种可能实现方式中,除了基于语音控制信号对应的关键词实现对虚拟对象的控制外,若虚拟对象具有语音交互功能,还可以基于语音控制信号对应的语音控制文本实现对虚拟对象的控制。基于语音控制信号对应的语音控制文本实现对虚拟对象的控制的方式为:响应于虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本,获取与语音交互文本对应的语音应答文本;控制虚拟对象对语音应答文本进行语音播报。
虚拟对象具有语音交互功能说明终端能够控制虚拟对象与交互对象进行对话。通常情况下,虚拟对象是否具有语音交互功能根据虚拟对象对应的第一目标智能化等级确定。智能化等级和语音控制词集合的对应关系还可以指示哪些智能化等级的虚拟对象具有语音交互功能。示例性地,表1所示的智能化等级和语音控制词集合的对应关系指示顶级或10级的智能化等级对应的虚拟对象具有语音交互功能。在此种情况下,若第一目标智能化等级为顶级或10级,则交互对象对应的虚拟对象具有语音交互功能。
语音控制信号对应的语音控制文本的获取过程参见步骤201,此处不再赘述。语音交互文本是指具有语音交互语义的文本。语音交互文本可以通过对语音控制文本进行分析得到。
当虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本时,说明终端能够基于语音控制信号对应的语音控制文本对虚拟对象进行控制,此时,获取与语音交互文本对应的语音应答文本,进而控制虚拟对象对语音应答文本进行语音播报。
在一种可能实现方式中,获取与语音交互文本对应的语音应答文本的方式包括但不限于以下两种:
方式1:从交互文本和应答文本的对应关系中查询与该语音交互文本对应的语音应答文本。
交互文本和应答文本的对应关系可以根据经验设置,也可以根据应用场景灵活调整,本申请实施例对此不加以限定。示例性地,该方式1中的交互文本和应答文本的对应关系是指第一目标智能化等级匹配的交互文本和应答文本的对应关系。也就说,不同的智能化等级可能匹配不同的交互文本和应答文本的对应关系。
在示例性实施例中,对于不同的智能化等级匹配不同的交互文本和应答文本的对应关系的情况,对于同一交互文本,基于较高的智能化等级匹配的交互文本和应答文本的对应关系确定的应答文本比基于较低的智能化等级匹配的交互文本和应答文本的对应关系确定的应答文本更加智能。
例如,对于交互文本为“你这个虚拟对象是不是太笨了”的情况,在较低的智能化等级匹配的交互文本和应答文本的对应关系中确定的应答文本可能为“不笨”;在较高的智能化等级匹配的交互文本和应答文本的对应关系中确定的应答文本可能为“我非常聪明,我一点也不笨哦”。基于此种方式,能够使得智能化等级高的虚拟对象带来更加智能的语音播报过程,提高玩家体验。
在示例性实施例中,在第一目标智能化等级匹配的交互文本和应答文本的对应关系中,一个交互文本可能对应一个或多个应答文本,不同的应答文本对应不同的应用场景。在此种情况下,从交互文本和应答文本的对应关系中查询与该语音交互文本对应的语音应答文本的过程为:确定虚拟对象当前所处的应用场景,从交互文本和应答文本的对应关系中查询与该语音交互文本和当前所处的应用场景均对应的语音应答文本。
例如,当虚拟对象为处于驾驶模式中的虚拟对象时,应用场景包括但不限于高速驾驶场景和静止场景,在不同的应用场景下可以对应不同风格和不同内容的应答文本。例如,高速驾驶场景下对应风格冷静内容简洁的应答文本,静止场景下对应风格轻松内容丰富的应答文本。示例性地,虚拟对象处于静止场景是指虚拟对象的移动速度小于参考阈值(例如,参考阈值为0.1),且LBS(Location Based Services,基于位置的服务)指示虚拟对象未处于道路上。
在示例性实施例中,越高的智能化等级匹配的交互文本和应答文本的对应关系中涵盖划分越细致的应用场景下对应的应答文本,从而使智能化等级高的虚拟对象能够为交互对象带来更加智能化的体验。
方式2:利用文本处理模型对语音交互文本进行处理,将文本处理模型输出的文本作为语音应答文本。
文本处理模型用于通过对语音交互文本进行语义分析,输出用于对该语音交互文本进行回复的语音应答文本。文本处理模型可以基于训练交互文本以及训练交互文本对应的训练应答文本进行有监督训练得到。
在示例性实施例中,不同的智能化等级可以对应不同的文本处理模型,较高的智能化等级对应的文本处理模型在对语音交互文本进行处理的过程中,可以综合考虑虚拟对象所处的应用场景,然后输出符合应用场景的对语音交互文本进行应答的语音应答文本,提高智能化体验。需要说明的是,越高的智能化等级对应的文本处理模型输出的语音应答文本越符合真实的应用场景,以体现不同智能化等级的虚拟对象的不同智能化程度。
在一种可能实现方式中,在控制虚拟对象对语音应答文本进行语音播报之后,返回执行步骤201继续获取交互对象的语音控制信号,从而能够实现虚拟对象与交互对象之间的对话和闲聊。
需要说明的是,基于语音控制文本能够获取到语音控制信号对应的至少一个关键词的情况和虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本的情况并不互斥。也就是说,在满足基于语音控制文本能够获取到语音控制信号对应的至少一个关键词的情况时,可能满足虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本的情况,也可能不满足虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本的情况。此外,在满足虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本的情况下,可能满足基于语音控制文本能够获取到语音控制信号对应的至少一个关键词的情况,也可能不满足基于语音控制文本能够获取到语音控制信号对应的至少一个关键词的情况。这些与语音控制信号的具体内容以及虚拟对象对应的智能化等级有关。
在仅满足以上两种情况中的任一种情况时,仅执行一种情况下的控制过程;在同时满足以上两种情况时,执行两种情况下的控制过程,本申请实施例对两种情况下的控制过程的实现顺序不加以限定。
在一种可能实现方式中,在基于语音控制文本未获取到语音控制信号对应的至少一个关键词、不满足虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本的情况下,终端执行提示操作。该提示操作用于指示基于语音控制信号无法对虚拟对象进行控制。本申请实施例对执行提示操作的方式不加以限定。示例性地,执行提示操作是指在虚拟对象所处的显示页面显示用于指示基于语音控制信号无法对虚拟对象进行控制的文字信息。示例性地,执行提示操作是指在播报用于指示基于语音控制信号无法对虚拟对象进行控制的语音。在执行提示操作后,可以提示交互对象当前采集的语音控制信号无效,从而使交互对象更换语音控制信号或者提升虚拟对象的智能化等级。
在步骤204中,响应于至少一个关键词中存在匹配成功的关键词,控制虚拟对象对目标控制信息进行响应,目标控制信息为匹配成功的关键词指示的控制信息。
当至少一个关键词中存在匹配成功的关键词时,说明终端能够基于此次获取的语音控制信号对应的关键词实现对虚拟对象的控制,也说明语音控制信号对应的关键词与虚拟对象的智能化程度相匹配。在此种情况下,终端将匹配成功的关键词指示的控制信息作为目标控制信息,控制虚拟对象对目标控制信息进行响应。
匹配成功的关键词的数量为一个或多个,本申请实施例对此不加以限定。目标控制信息用于指示终端应该控制虚拟对象进行怎样的响应。示例性地,假设语音控制信号对应的关键词有两个,分别为“快快快”和“撤退”,这两个关键词均匹配成功,此种情况下,目标控制信息包括关键词“撤退”指示的撤退指令信息和关键词“快快快”指示的焦急情绪信息。撤退操作指令信息用于指示终端应该控制虚拟对象进行撤退动作,焦急情绪信息用于指示终端应该控制虚拟对象对交互对象的焦急情绪进行调节。
在一种可能实现方式中,确定目标控制信息的方式包括但不限于以下两种:
方式1:在第一语音控制词集合对应的控制信息集合中查询与匹配成功的关键词对应的控制信息,将查询到的控制信息作为目标控制信息。
控制信息集合中包括各个第一语音控制词指示的控制信息。在示例性实施例中,可以为每个语音控制词集合分别设置控制信息集合,此种情况下,第一语音控制词集合对应的控制信息集合中有且仅有第一语音控制词集合中的各个语音控制词分别指示的控制信息。在示例性实施例中,还可以为各个语音控制词集合统一设置一个综合的控制信息集合,此种情况下,第一语音控制词集合对应的控制信息集合中除包括第一语音控制词集合中的各个语音控制词分别指示的控制信息外,还包括其他语音控制词集合中的语音控制词指示的控制信息。
方式2:对匹配成功的关键词进行语义分析处理,得到目标控制信息。
语义分析处理能够识别匹配成功的关键词指示的含义,根据该指示的含义即可得到指示的控制信息。
在一种可能实现方式中,控制虚拟对象对目标控制信息进行响应的过程包括:确定第一目标智能化等级对应的目标响应速度;控制虚拟对象按照目标响应速度对目标控制信息进行响应。
游戏类应用程序的开发者除设置智能化等级和语音控制词集合的对应关系外,还可以设置智能化等级和响应速度的对应关系,以使较高智能化等级的虚拟对象对控制信息的响应速度不低于较低智能化等级的虚拟对象。在智能化等级和响应速度的对应关系中查询与第一目标智能化等级对应的响应速度,将与第一目标智能化等级对应的响应速度作为目标响应速度。然后控制虚拟对象按照响应速度对目标控制信息进行响应。在示例性实施例中,智能化等级越高,对应的响应速度越快,以通过响应速度的快慢体现虚拟对象的智能化程度的高低。
在示例性实施例中,对于利用程度表示智能化等级的情况,不同程度的智能化等级对应的语音控制词集合不同,对应的响应速度也不同。越高程度的智能化等级对应的语音控制词集合中的语音控制词涉及的类别越多,对应的响应速度也越快。例如,高级的智能化等级对应的语音控制词集合中的语音控制词涉及的类别比中级的智能化等级对应的语音控制词集合中的语音控制词涉及的类别多、比顶级的智能化等级对应的语音控制词集合中的语音控制词涉及的类别少。高级的智能化等级对应的响应速度比中级的智能化等级对应的响应速度快、比顶级的智能化等级对应的响应速度慢。
在另一种示例性实施例中,对于利用分值表示智能化等级的情况,在满足较高的智能化等级对应的语音控制词集合中的语音控制词不少于较低的智能化等级对应的语音控制词集合中的语音控制词的基础上,不同分值的智能化等级对应的语音控制词集合可能相同,如,2级~4级的智能化等级对应的语音控制词集合相同。但是,不同分值的智能化等级对应的响应速度不同,以体现不同分值的智能化等级之间的智能化程度的差异。例如,3级的智能化等级对应的响应速度比2级的智能化等级对应的响应速度快、比4级的智能化等级对应的响应速度慢。
目标控制信息是指与第一语音控制词集合匹配成功的关键词指示的控制信息,根据第一目标智能化等级的不同,第一语音控制词集合也不同,目标控制信息也不同。在一种可能实现方式中,目标控制信息对应以下任一种情况:
情况1:目标控制信息仅包括操作指令信息。
在示例性实施例中,当第一目标智能化等级较低时,匹配成功的关键词可能仅包括操作指令类的词,此时,目标控制信息仅包括操作指令信息。操作指令信息用于指示需要执行的动作。在一种可能实现方式中,在情况1下,终端控制虚拟对象对目标控制信息进行响应的方式包括但不限于以下两种:
方式1:控制虚拟对象执行操作指令信息指示的动作。
不同的操作指令信息指示不同的动作,在此种方式1中,控制虚拟对象对目标控制信息进行响应的方式仅包括控制虚拟对象执行操作指令信息指示的动作。示例性地,当操作指令信息为撤退指令信息时,控制虚拟对象执行撤退动作。
需要说明的是,目标控制信息中包括的操作指令信息可以是指一个或多个操作指令对应的信息,本申请实施例对此不加以限定。也就是说,交互对象可能希望虚拟对象基于语音控制信号执行一种或多种动作。当目标控制信息中包括的操作指令信息是指多个操作指令对应的信息时,操作指令信息指示的多个动作可能为能够同时执行的动作,也可能为不能够同时执行的动作。当操作指令信息指示的多个动作为能够同时执行的动作时,终端控制虚拟对象执行操作指令信息指示的动作的过程为:终端控制虚拟对象同时执行操作指令信息指示的多个动作;当操作指令信息指示的多个动作为不能够同时执行的动作时,终端控制虚拟对象执行操作指令信息指示的动作的过程为:终端控制虚拟对象依次执行操作指令信息指示的多个动作。
方式2:控制虚拟对象执行操作指令信息指示的动作,且控制虚拟对象播报与操作指令信息匹配的内容。
在此种方式2下,终端除控制虚拟对象执行操作指令信息指示的动作外,还控制虚拟对象进行语音播报,此时语音播报的内容为与操作指令信息匹配的内容。与操作指令信息匹配的内容用于提示交互对象,虚拟对象正在执行操作指令信息指示的动作或者已经完成操作指令信息指示的动作。
在示例性实施例中,终端可以预先设置并存储操作指令信息与内容的匹配关系,然后从操作指令信息与内容的匹配关系中查询与目标控制信息中的操作指令信息匹配的内容,控制虚拟对象对该与操作指令信息匹配的内容进行语音播报。例如,当操作指令信息为吃仙草指令对应的信息时,与操作指令信息匹配的内容可以是指文字“好的,吃仙草回血中”。
在示例性实施例中,在设置操作指令信息与内容的匹配关系的过程中,为不同的智能化等级设置不同的操作指令信息与内容的匹配关系。在此种情况下,从第一目标智能化等级对应的操作指令信息与内容的匹配关系中查询与目标控制信息中的操作指令信息匹配的内容。
在示例性实施例中,对于不同的智能化等级对应不同的操作指令信息与内容的匹配关系的情况,对于同一操作指令信息,基于较高的智能化等级对应的操作指令信息与内容的匹配关系确定的内容比基于较低的智能化等级对应的操作指令信息与内容的匹配关系确定的内容更加智能。
在示例性实施例中,在任一智能化等级对应的操作指令信息与内容的匹配关系中,一个操作指令信息可能匹配一个或多个应用场景下的内容。对于此种情况,越高的智能化等级对应的操作指令信息与内容的匹配关系中涵盖划分越细致的应用场景下对应的内容,从而起到根据真实的游戏状态对语音播报的内容进行适应性调整的作用,使得智能化等级高的虚拟对象为交互对象带来更加智能、更加真实的体验感。此种方式,能够使得具有越高的智能化等级的虚拟对象,利用越智能的方式进行语音播报,提高玩家提升虚拟对象的智能化等级的兴趣,提高游戏运营效果。
在示例性实施例中,终端控制虚拟对象进行语音播报可以是指控制虚拟对象根据自身的语音播报属性进行语音播报,虚拟对象自身的语音播报属性包括但不限于虚拟对象的音色、虚拟对象播报速度等。在示例性实施例中,终端控制虚拟对象进行语音播报也可以是指控制虚拟对象根据实时确定的语音播报属性进行语音播报。实时确定的语音播报属性与虚拟对象的智能化等级和虚拟对象当前所处的应用场景有关,本申请实施例对此不加以限定。
情况2:目标控制信息仅包括情绪信息。
匹配成功的关键词还可能仅包括语气情绪类的词,此时,目标控制信息仅包括情绪信息。情绪信息是指匹配成功的语气情绪类的词对应的情绪。情绪信息用于指示交互对象当前的情绪,示例性地,当语气情绪类的词为“太气了”时,该语气情绪类的词对应的情绪为生气,此时目标控制信息包括的情绪信息用于指示生气的情绪。
在一种可能实现方式中,在情况2下,终端控制虚拟对象对目标控制信息进行响应的方式为:终端控制虚拟对象播报与情绪信息匹配的内容。播报与情绪信息匹配的内容能够对交互对象的情绪进行调节。
在示例性实施例中,终端可以预先设置并存储情绪信息与内容的匹配关系,然后从情绪信息与内容的匹配关系中查询与目标控制信息中的情绪信息匹配的内容,控制虚拟对象对该与情绪信息匹配的内容进行语音播报。例如,当情绪信息用于指示生气的情绪时,与情绪信息匹配的内容可以是指文字“生气伤身哦”。需要说明的是,情绪信息与内容的匹配关系的设置过程可以参见情况1中所述的操作指令信息与内容的匹配关系的设置过程,此处不再赘述。
情况3:目标控制信息包括操作指令信息和情绪信息。
匹配成功的关键词还可能既包括操作指令类的词,又包括语气情绪类的词,此时,目标控制信息既包括操作指令信息,又包括情绪信息。
在一种可能实现方式中,在情况3下,终端控制虚拟对象对目标控制信息进行响应的方式包括但不限于以下两种:
方式a:控制虚拟对象执行操作指令信息指示的动作,且控制虚拟对象播报与情绪信息匹配的内容。
在此种方式a下,终端一方面控虚拟对象执行操作指令信息指示的动作,另一方面控制虚拟对象播报与情绪信息匹配的内容。此种方式相当于情况1中的方式1和情况2中的实现方式的结合,此处不再赘述。
方式b:控制虚拟对象执行操作指令信息指示的动作,且控制虚拟对象播报与操作指令信息和情绪信息均匹配的内容。
在此种方式a下,终端一方面控虚拟对象执行操作指令信息指示的动作,另一方面控制虚拟对象播报与操作指令信息和情绪信息均匹配的内容。相比于方式a,方式b中控制虚拟对象播报的内容更全面,有利于进一步提高交互对象的游戏体验。
在示例性实施例中,终端可以预先设置并存储操作指令信息-情绪信息组与内容的匹配关系,然后从操作指令信息-情绪信息组与内容的匹配关系中查询与目标控制信息中的操作指令信息和情绪信息构成的操作指令信息-情绪信息组匹配的内容,控制虚拟对象对该与操作指令信息和情绪信息构成的操作指令信息-情绪信息组匹配的内容进行语音播报。与操作指令信息和情绪信息构成的操作指令信息-情绪信息组匹配的内容即为与操作指令信息和情绪信息均匹配的内容。
例如,假设目标控制信息中包括的操作指令信息为撤退操作指令对应的信息、目标控制信息中包括的情绪信息用于指示着急的情绪,此种情况下,与操作指令信息和情绪信息均匹配的内容可以是指文字“不要着急,正在加速撤退中”。
需要说明的是,操作指令信息-情绪信息组与内容的匹配关系的设置过程可以参见情况1中所述的操作指令信息与内容的匹配关系的设置过程,此处不再赘述。
在一种可能实现方式中,在控制虚拟对象进行语音播报的过程中,终端还可以在虚拟对象所处页面的指定位置显示与播报的内容相对应的文字信息,以起到更进一步地提示作用。
在一种可能实现方式中,在控制虚拟对象对目标控制信息进行响应之后,交互对象能够继续进行游戏,在交互对象对应的虚拟对象不断取得游戏成果或者不断参加游戏活动的过程中,虚拟对象对应的智能化等级可能发生更新,此时,终端在虚拟对象所在的显示页面中的第一位置处显示用于对更新后的智能化等级进行提示的提示信息。
示例性地,假设基于语音控制文本能够获取到语音控制信号对应的至少一个关键词,但是第一目标智能化等级的虚拟对象不具有语音交互功能或者语音控制文本中不包括语音交互文本,此时,终端对虚拟对象的控制过程如图5所示。在游戏开始时,打开语音采集装置;根据虚拟对象对应的第一目标智能化等级确定对应的第一语音控制词集合;利用语音采集装置采集针对虚拟对象的语音控制信号;获取到语音控制信号对应的关键词;将关键词与第一语音控制词集合进行匹配;当存在匹配成功的关键词(匹配)时,控制虚拟对象对匹配成功的关键词指示的控制信息进行响应;当不存在匹配成功的关键词(不匹配)时,放弃语音控制信号,执行提示操作。
在一种可能实现方式中,在虚拟对象对应的智能化等级发生更新的情况下,还包括:响应于虚拟对象对应的智能化等级由第一目标智能化等级更新为第二目标智能化等级,获取第二目标智能化等级对应的第二语音控制词集合;基于第二语音控制词集合实现对虚拟对象的控制。也就是说,若虚拟对象的智能化等级发生变化,则根据更新后的智能化等级对应的语音控制词集合实现对虚拟对象的控制。据更新后的智能化等级对应的语音控制词集合实现对虚拟对象的控制可以参见上述步骤201至步骤204的过程,此处不再赘述。需要说明的是,第二目标智能化等级为虚拟对象对应的更新后的智能化等级,第二目标智能化等级可能比第一目标智能化等级高,也可能比第一目标智能化等级低,本申请实施例对此不加以限定。
在一种可能实现方式中,在第一语音控制词集合和第二语音控制词集合不同的情况下,还包括:获取第二语音控制词集合与第一语音控制词集合之间的差异词集合;在虚拟对象所处的显示页面中的第三位置处显示第三提示信息,第三提示信息用于对差异词集合进行提示。
当第二目标智能化等级比第一目标智能化等级高时,第二语音控制词集合中的语音控制词除包括第一语音控制词集合中的全部语音控制词外,还增加了新的语音控制词,此时,第二语音控制词集合与第一语音控制词集合之间的差异词集合是指第二语音控制词集合相比于第一语音控制词集合增加的语音控制词的集合。当第二目标智能化等级比第一目标智能化等级低时,第二语音控制词集合中的语音控制词少于第一语音控制词集合中的语音控制词,此时,第二语音控制词集合与第一语音控制词集合之间的差异词集合是指第二语音控制词集合相比于第一语音控制词集合减少的语音控制词的集合。
在确定第二语音控制词集合与第一语音控制词集合之间的差异词集合后,在虚拟对象所处的显示页面中的第三位置处显示第三提示信息,该第三提示信息用于对差异词集合进行提示。第三提示信息中包括用于指示差异词集合对应的差异方式的信息以及与差异词集合相关的信息。
当第二语音控制词集合与第一语音控制词集合之间的差异词集合是指第二语音控制词集合相比于第一语音控制词集合增加的语音控制词的集合时,用于指示差异词集合对应的差异方式的信息包括但不限于增加、解锁等;当第二语音控制词集合与第一语音控制词集合之间的差异词集合是指第二语音控制词集合相比于第一语音控制词集合减少的语音控制词的集合时,用于指示差异词集合对应的差异方式的信息包括但不限于减少、封锁等。
与差异词集合相关的信息可以是指包括差异词集合中的全部差异词的信息,也可以是指包括差异词集合中的全部差异词对应的全部类别的信息,本申请实施例对此不加以限定。例如,以智能化等级与语音控制词集合的对应关系如表1所示为例,当第一目标智能等级为低级,第二目标智能等级为中级时,第二语音控制词集合与第一语音控制词集合的差异词集合为给养补充指令类的词的集合,此种情况下,第三提示信息可以为“您已解锁给养补充指令类的语音控制词”。
在本申请实施例中,设计了一种新型的基于语音识别技术和语义理解技术的游戏虚拟对象的智能化等级的设定方法。玩家用户通过语音对游戏中的虚拟对象下达指令,通过语音识别和语义理解技术,语音命令转化成实际的指令对游戏中的虚拟对象进行操作。对游戏中的虚拟对象的“智力”进行设定,不同“智力”的虚拟对象只能识别相应等级的语音类指令。“智力”越高,能够识别的语音指令越多,顶级“智力”的虚拟对象还能够识别交互对象的语气情绪,以及进行对话回复等,从而使游戏中的虚拟对象更加智能化,大大提升了玩家用户的游戏体验,提升了真实的浸入感。
在本申请实施例中,虚拟对象对应有智能化等级,智能化等级对应有语音控制词集合,在此基础上,根据玩家的语音控制信号即可实现对虚拟对象的控制,虚拟对象的控制过程的实现无需玩家执行复杂操作,人机交互的便捷性较高,有利于提高虚拟对象的控制效果,提升玩家的游戏体验。
参见图6,本申请实施例提供了一种虚拟对象的控制装置,该装置包括:
获取模块601,用于获取针对虚拟对象的语音控制信号;
确定模块602,用于确定虚拟对象对应的第一目标智能化等级;
获取模块601,还用于获取第一目标智能化等级对应的第一语音控制词集合,第一目标智能化等级用于指示虚拟对象的智能化程度;第一目标智能化等级为智能化等级集合中的智能化等级;对于智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量;
匹配模块603,用于将语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配;
控制模块604,用于响应于至少一个关键词中存在匹配成功的关键词,控制虚拟对象对目标控制信息进行响应,目标控制信息为匹配成功的关键词指示的控制信息。
在一种可能实现方式中,控制模块604,用于确定第一目标智能化等级对应的目标响应速度;控制虚拟对象按照目标响应速度对目标控制信息进行响应。
在一种可能实现方式中,获取模块601,还用于响应于虚拟对象具有语音交互功能且语音控制信号对应的语音控制文本包括语音交互文本,获取与语音交互文本对应的语音应答文本;
控制模块604,还用于控制虚拟对象对语音应答文本进行语音播报。
在一种可能实现方式中,获取模块601,还用于获取语音控制信号对应的语音控制文本;
参见图7,该装置还包括:
处理模块605,用于对语音控制文本进行词划分处理,得到语音控制文本对应的至少一个基础词;
获取模块601,还用于对于至少一个基础词中的任一基础词,获取任一基础词对应的分类结果,响应于任一基础词对应的分类结果满足参考条件,将任一基础词作为语音控制信号对应的关键词。
在一种可能实现方式中,参见图7,该装置还包括:
显示模块606,用于执行以下至少一种显示方式:
在虚拟对象所处的显示页面中的第一位置处显示第一提示信息,第一提示信息用于对虚拟对象对应的第一目标智能化等级进行提示;
在虚拟对象所处的显示页面中的第二位置处显示第二提示信息,第二提示信息用于对第一语音控制词集合进行提示。
在一种可能实现方式中,获取模块601,还用于响应于虚拟对象对应的智能化等级由第一目标智能化等级更新为第二目标智能化等级,获取第二目标智能化等级对应的第二语音控制词集合;
控制模块604,还用于基于第二语音控制词集合实现对虚拟对象的控制;
在一种可能实现方式中,获取模块601,还用于获取第二语音控制词集合与第一语音控制词集合之间的差异词集合;
显示模块606,还用于在虚拟对象所处的显示页面中的第三位置处显示第三提示信息,第三提示信息用于对差异词集合进行提示。
在一种可能实现方式中,目标控制信息包括操作指令信息,控制模块604,用于控制虚拟对象执行操作指令信息指示的动作;或者,控制虚拟对象执行操作指令信息指示的动作,且控制虚拟对象播报与操作指令信息匹配的内容。
在一种可能实现方式中,目标控制信息包括情绪信息,控制模块604,用于控制虚拟对象播报与情绪信息匹配的内容。
在本申请实施例中,虚拟对象对应有智能化等级,智能化等级对应有语音控制词集合,在此基础上,根据玩家的语音控制信号即可实现对虚拟对象的控制,虚拟对象的控制过程的实现无需玩家执行复杂操作,人机交互的便捷性较高,有利于提高虚拟对象的控制效果,提升玩家的游戏体验。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图8是本申请实施例提供的一种终端的结构示意图。该终端可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端包括有:处理器801和存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable LogicArray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的虚拟对象的控制方法。
在一些实施例中,终端还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807、定位组件808和电源809中的至少一种。
外围设备接口803可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏805可以为一个,设置在终端的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。
定位组件808用于定位终端的当前地理位置,以实现导航或LBS(LocationBasedService,基于位置的服务)。
电源809用于为终端中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
加速度传感器811可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测终端的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在终端的侧边框和/或显示屏805的下层。当压力传感器813设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时,由处理器801根据用户对显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商Logo时,指纹传感器814可以与物理按键或厂商Logo集成在一起。
光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制显示屏805的显示亮度。具体地,当环境光强度较高时,调高显示屏805的显示亮度;当环境光强度较低时,调低显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。
接近传感器816,也称距离传感器,通常设置在终端的前面板。接近传感器816用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端的正面之间的距离逐渐变小时,由处理器801控制显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端的正面之间的距离逐渐变大时,由处理器801控制显示屏805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图8中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图9是本申请实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(CentralProcessing Units,CPU)901和一个或多个存储器902,其中,该一个或多个存储器902中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器901加载并执行,以实现上述各个方法实施例提供的虚拟对象的控制方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条程序代码。该至少一条程序代码由一个或者一个以上处理器加载并执行,以实现上述任一种虚拟对象的控制方法。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,该至少一条程序代码由计算机设备的处理器加载并执行,以实现上述任一种虚拟对象的控制方法。
在一种可能实现方式中,上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact DiscRead-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一种虚拟对象的控制方法。
需要说明的是,本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种虚拟对象的控制方法,其特征在于,所述方法包括:
获取针对虚拟对象的语音控制信号;
确定所述虚拟对象对应的第一目标智能化等级,获取所述第一目标智能化等级对应的第一语音控制词集合,所述第一目标智能化等级用于指示所述虚拟对象的智能化程度;所述第一目标智能化等级为智能化等级集合中的智能化等级;对于所述智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量;
将所述语音控制信号对应的至少一个关键词与所述第一语音控制词集合进行匹配;响应于所述至少一个关键词中存在匹配成功的关键词,确定所述第一目标智能化等级对应的目标响应速度,控制所述虚拟对象按照所述目标响应速度对目标控制信息进行响应,所述目标控制信息为匹配成功的关键词指示的控制信息;
响应于所述第一目标智能化等级指示所述虚拟对象具有语音交互功能且所述语音控制信号对应的语音控制文本包括语音交互文本,从第一目标智能化等级匹配的交互文本和应答文本的对应关系中查询与所述语音交互文本对应的语音应答文本,或者,利用所述第一目标智能化等级对应的文本处理模型对所述语音交互文本进行处理,将所述文本处理模型输出的文本作为语音应答文本;控制所述虚拟对象对所述语音应答文本进行语音播报。
2.根据权利要求1所述的方法,其特征在于,所述将所述语音控制信号对应的至少一个关键词与所述第一语音控制词集合进行匹配之前,所述方法还包括:
获取所述语音控制信号对应的语音控制文本;
对所述语音控制文本进行词划分处理,得到所述语音控制文本对应的至少一个基础词;
对于所述至少一个基础词中的任一基础词,获取所述任一基础词对应的分类结果,响应于所述任一基础词对应的分类结果满足参考条件,将所述任一基础词作为所述语音控制信号对应的关键词。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括以下至少一种显示方式:
在所述虚拟对象所处的显示页面中的第一位置处显示第一提示信息,所述第一提示信息用于对所述虚拟对象对应的第一目标智能化等级进行提示;
在所述虚拟对象所处的显示页面中的第二位置处显示第二提示信息,所述第二提示信息用于对所述第一语音控制词集合进行提示。
4.根据权利要求1-3任一所述的方法,其特征在于,所述控制所述虚拟对象按照所述目标响应速度对目标控制信息进行响应之后,所述方法还包括:
响应于所述虚拟对象对应的智能化等级由第一目标智能化等级更新为第二目标智能化等级,获取所述第二目标智能化等级对应的第二语音控制词集合;
基于所述第二语音控制词集合实现对所述虚拟对象的控制。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第二语音控制词集合实现对所述虚拟对象的控制之前,所述方法还包括:
获取所述第二语音控制词集合与所述第一语音控制词集合之间的差异词集合;
在所述虚拟对象所处的显示页面中的第三位置处显示第三提示信息,所述第三提示信息用于对所述差异词集合进行提示。
6.根据权利要求1-3任一所述的方法,其特征在于,所述目标控制信息包括操作指令信息,所述控制所述虚拟对象按照所述目标响应速度对目标控制信息进行响应,包括:
仅控制所述虚拟对象按照所述目标响应速度执行所述操作指令信息指示的动作;或者,
控制所述虚拟对象按照所述目标响应速度执行所述操作指令信息指示的动作,且控制所述虚拟对象按照所述目标响应速度播报与所述操作指令信息匹配的内容。
7.根据权利要求1-3任一所述的方法,其特征在于,所述目标控制信息包括情绪信息,所述控制所述虚拟对象按照所述目标响应速度对目标控制信息进行响应,包括:
控制所述虚拟对象按照所述目标响应速度播报与所述情绪信息匹配的内容。
8.一种虚拟对象的控制装置,其特征在于,所述装置包括:
获取模块,用于获取针对虚拟对象的语音控制信号;
确定模块,用于确定所述虚拟对象对应的第一目标智能化等级;
所述获取模块,还用于获取所述第一目标智能化等级对应的第一语音控制词集合,所述第一目标智能化等级用于指示所述虚拟对象的智能化程度;所述第一目标智能化等级为智能化等级集合中的智能化等级;对于所述智能化等级集合中的任两个智能化等级,较高的智能化等级对应的语音控制词集合中的语音控制词的数量不少于较低的智能化等级对应的语音控制词集合中的语音控制词的数量;
匹配模块,用于将所述语音控制信号对应的至少一个关键词与第一语音控制词集合进行匹配;
控制模块,用于响应于所述至少一个关键词中存在匹配成功的关键词,确定所述第一目标智能化等级对应的目标响应速度,控制所述虚拟对象按照所述目标响应速度对目标控制信息进行响应,所述目标控制信息为匹配成功的关键词指示的控制信息;
所述获取模块,还用于响应于所述第一目标智能化等级指示所述虚拟对象具有语音交互功能且所述语音控制信号对应的语音控制文本包括语音交互文本,从第一目标智能化等级匹配的交互文本和应答文本的对应关系中查询与所述语音交互文本对应的语音应答文本,或者,利用所述第一目标智能化等级对应的文本处理模型对所述语音交互文本进行处理,将所述文本处理模型输出的文本作为语音应答文本;
所述控制模块,还用于控制所述虚拟对象对所述语音应答文本进行语音播报。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至7任一所述的虚拟对象的控制方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至7任一所述的虚拟对象的控制方法。
CN202010843355.2A 2020-08-20 2020-08-20 虚拟对象的控制方法、装置、设备及存储介质 Active CN112742024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010843355.2A CN112742024B (zh) 2020-08-20 2020-08-20 虚拟对象的控制方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010843355.2A CN112742024B (zh) 2020-08-20 2020-08-20 虚拟对象的控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112742024A CN112742024A (zh) 2021-05-04
CN112742024B true CN112742024B (zh) 2023-02-10

Family

ID=75645649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010843355.2A Active CN112742024B (zh) 2020-08-20 2020-08-20 虚拟对象的控制方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112742024B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115460060B (zh) * 2022-07-29 2024-03-22 青岛海尔科技有限公司 智能设备的设备升级方法及装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1385783A (zh) * 2001-05-14 2002-12-18 索尼电脑娱乐美国公司 在游戏环境中以菜单驱动的语音来控制角色的系统和方法
JP2005118372A (ja) * 2003-10-17 2005-05-12 Aruze Corp ゲーム機、ゲームの実行方法、並びにこれらのためのプログラム
CN108320744A (zh) * 2018-02-07 2018-07-24 广东欧珀移动通信有限公司 语音处理方法和装置、电子设备、计算机可读存储介质
CN109589603A (zh) * 2018-11-30 2019-04-09 广州要玩娱乐网络技术股份有限公司 游戏操作控制方法、装置、介质和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1385783A (zh) * 2001-05-14 2002-12-18 索尼电脑娱乐美国公司 在游戏环境中以菜单驱动的语音来控制角色的系统和方法
JP2005118372A (ja) * 2003-10-17 2005-05-12 Aruze Corp ゲーム機、ゲームの実行方法、並びにこれらのためのプログラム
CN108320744A (zh) * 2018-02-07 2018-07-24 广东欧珀移动通信有限公司 语音处理方法和装置、电子设备、计算机可读存储介质
CN109589603A (zh) * 2018-11-30 2019-04-09 广州要玩娱乐网络技术股份有限公司 游戏操作控制方法、装置、介质和计算机设备

Also Published As

Publication number Publication date
CN112742024A (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
CN110379430B (zh) 基于语音的动画显示方法、装置、计算机设备及存储介质
CN110288077B (zh) 一种基于人工智能的合成说话表情的方法和相关装置
US20210295099A1 (en) Model training method and apparatus, storage medium, and device
CN110322760B (zh) 语音数据生成方法、装置、终端及存储介质
CN111524501B (zh) 语音播放方法、装置、计算机设备及计算机可读存储介质
CN111031386B (zh) 基于语音合成的视频配音方法、装置、计算机设备及介质
CN110572716B (zh) 多媒体数据播放方法、装置及存储介质
CN112511850B (zh) 连麦方法、直播显示方法、装置、设备及存储介质
CN111739517B (zh) 语音识别方法、装置、计算机设备及介质
CN110263131B (zh) 回复信息生成方法、装置及存储介质
CN112749956A (zh) 信息处理方法、装置及设备
CN114299933A (zh) 语音识别模型训练方法、装置、设备、存储介质及产品
CN113750523A (zh) 三维虚拟对象的动作生成方法、装置、设备及存储介质
CN109982129A (zh) 短视频的播放控制方法、装置及存储介质
CN114333774B (zh) 语音识别方法、装置、计算机设备及存储介质
CN111835621A (zh) 会话消息处理方法、装置、计算机设备及可读存储介质
CN111582862A (zh) 信息处理方法、装置、系统、计算机设备及存储介质
CN112742024B (zh) 虚拟对象的控制方法、装置、设备及存储介质
CN110798327A (zh) 消息处理方法、设备及存储介质
CN111428079B (zh) 文本内容处理方法、装置、计算机设备及存储介质
CN113409770A (zh) 发音特征处理方法、装置、服务器及介质
CN115658857A (zh) 智能对话方法、装置、设备及存储介质
CN115168643A (zh) 音频处理方法、装置、设备及计算机可读存储介质
CN111597823B (zh) 中心词提取方法、装置、设备及存储介质
CN116704080B (zh) 眨眼动画生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40044519

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant