WO2023030010A1

WO2023030010A1 - 交互方法、电子设备及存储介质

Info

Publication number: WO2023030010A1
Application number: PCT/CN2022/113037
Authority: WO
Inventors: 于洪达; 范海军; 吴迪; 罗涛; 侯大海; 敦会永; 辛孟怡
Original assignee: 京东方科技集团股份有限公司
Priority date: 2021-08-31
Filing date: 2022-08-17
Publication date: 2023-03-09
Also published as: CN113641442A

Abstract

一种交互方法、电子设备及存储介质。该交互方法，包括：在首页界面中显示至少一个服务对应的标识信息；接收针对所述至少一个服务对应的标识信息中与目标服务对应的目标标识信息的第一选择操作；响应于所述第一选择操作，基于所述目标标识信息，在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的目标显示对象。

Description

交互方法、电子设备及存储介质

本申请要求于2021年08月31日提交中国专利局、申请号为202111010753.7、发明名称为“交互方法、电子设备及存储介质”的中国专利申请的优先权，其内容应理解为通过引用的方式并入本申请中。

技术领域

本公开实施例涉及但不限于人工智能技术领域，尤其涉及一种交互方法、电子设备及存储介质。

背景技术

随着计算机技术的发展和人工智能技术的进步，智能化人机交互方式已成为现阶段人机交互的主流。

目前，可以在商场、展厅等场所放置电子设备，通过电子设备向用户提供服务。然而，现阶段的人机交互方式主要为语音交互或者图文交互，交互方式较为单一，无法模拟真实环境下的人与人之间的交互状态，使得用户的交互体验较差。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

第一方面，本公开实施例提供了一种交互方法，包括：在首页界面中显示至少一个服务对应的标识信息；接收针对所述至少一个服务对应的标识信息中与目标服务对应的目标标识信息的第一选择操作；响应于所述第一选择操作，基于所述目标标识信息，在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的目标显示对象。

第二方面，本公开实施例提供了一种电子设备，包括：处理器以及存储有可在处理器上运行的计算机程序的存储器，其中，所述处理器执行所述程序时实现如上述实施例中所述的交互方法的步骤。

第三方面，本公开实施例提供了一种计算机可读存储介质，包括存储的程序，其中，在所述程序运行时控制所述存储介质所在的设备执行如上述实施例中所述的交互方法的步骤。

本公开的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本公开而了解。本公开的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

附图用来提供对本公开技术方案的理解，并且构成说明书的一部分，与本公开的实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。附图中各部件的形状和大小不反映真实比例，目的只是示意说明本公开内容。

图1为本公开示例性实施例中的交互方法的流程示意图；

图2A为本公开示例性实施例中的3D导览界面的第一种示意图；

图2B为本公开示例性实施例中的3D导览界面的第二种示意图；

图2C为本公开示例性实施例中的3D导览界面的第三种示意图；

图2D为本公开示例性实施例中的3D导览界面的第四种示意图；

图3为本公开示例性实施例中的3D推荐界面的示意图；

图4为本公开示例性实施例中的交互方法的应用场景的示意图；

图5为本公开示例性实施例中的电子设备的结构示意图。

具体实施方式

本文描述了多个实施例，但是该描述是示例性的，而不是限制性的，在本文所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在示例性实施方式中进行了讨论，但是所公开的特征的许多其它组合方式是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。

在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的，其它的步骤顺序是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本领域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本公开实施例的精神和范围内。

除非另外定义，本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。

在本公开示例性实施例中，使用的术语“模块”，可以是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。

本公开实施例提供一种交互方法。在实际应用中，该交互方法可以应用于交互装置中。例如，交互装置可以包括但不限于为：能提供3D数字人且包括用户界面的显示装置，可通过用户界面对3D数字人(又可称为虚拟对象或者虚拟人等)进行显示，用户可以与交互装置进行信息交互，这里，本公开对交互信息的实际内容不做限定。

在一种示例性实施例中，本公开实施例对交互装置的类型和结构不做限定，对交互装置所包括的部件不做限定。例如，交互装置可以包括但不限于以下部件：语音采集单元、语音播放单元、图像采集单元、显示单元等。例如，语音采集单元可以包括但不限于采用麦克风(microphone，MIC)阵列或者多个麦克风等。例如，语音播放单元可以包括但不限于采用至少一个喇叭等。例如，图像采集单元可以包括但不限于采用至少一个摄像头等。例如，显示单元可以包括但不限于采用液晶显示(Liquid Crystal Display，LCD)面板、有机发光二极管(Organic Light-Emitting Diode，OLED)显示面板或者量子点发光二极管(Quantum-dot Light Emitting Diodes，QLED)显示面板等。例如，该交互装置可以为平板电脑、智能手机、笔记本电脑、显示器或者机器人等具有显示功能和触控功能的电子设备。例如，该交互装置的高度可以基于用户的身高进行设定。这里，本公开实施例对此不做限定。

在一种示例性实施例中，该交互装置可以被设置于任意需要提供服务的场景中，例如，银行、展厅、园区、商场、机场、医院、学校、科研机构、政教或者交通等场所。这里，本公开实施例对此不做限定。

图1为本公开示例性实施例中的交互方法的流程示意图，如图1所示，该交互方法可以包括：

步骤11：在首页界面中显示至少一个服务对应的标识信息；

步骤12：接收针对至少一个服务对应的标识信息中与目标服务对应的目标标识信息的第一选择操作；

步骤13：响应于第一选择操作，基于目标标识信息，在目标服务界面显示处于执行与目标服务对应的动作的状态的3D数字人以及与目标服务对应的目标显示对象。

在一种示例性实施例中，使用的术语“界面”和“用户界面(User Interface，UI)”，又可以称为使用者界面或者人机交互界面，可以是指电子设备中的应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它可以实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式可以是图形用户界面(Graphic User Interface，GUI)，图形用户界面是指采用图形方式显示的与操作相关的用户界面。图形用户界面可以包括用于接收用户操作的图标、窗口、按钮、开关或者对话框等可视的界面元素，使得用户可以在图形用户界面中进行触发操作。可以理解，图形用户界面的实际内容可以根据实际的应用场景确定，这里，本公开实施例对此不做限定。

在一种示例性实施例中，3D数字人(又可称为虚拟对象或者虚拟人等)，可以是3D数字角色技术与人工智能技术的结晶。一方面，人像建模、动作捕捉等3D数字角色技术可以为3D数字人带来生动自然的形象表现，并使得3D数字人可以执行类似于人类的动作和表情，让用户可以感觉到类似于真实人为其服务的感受。另一方面，语音识别、自然语言理解、对话理解等人工智能(Artificial Intelligence，AI)技术可以为3D数字人带来完善的认知、理解和表达能力。数字人能够以电子屏幕、全息显示等设备为载体，基于电子设备与用户进行互动。

例如，可以使用3D建模技术，塑造真人比例的3D数字人，3D数字人可以包括：全身骨骼点、蒙皮、服饰、面部动作(例如，眨眼、唇动或者微笑)或者肢体动作(例如，弯腰、抬手或者静默)等。例如，3D数字人可以为基于骨骼点位控制的数字对象，即，3D数字人的动作形态控制可以依靠对3D数字人骨骼点位的控制，使得3D数字人可以执行类似于人类的动作和表情。例如，3D数字人的动作可以来自建模时手动逐帧制作，或者，可以来自后期动作捕捉后适配到模型骨骼。

例如，3D数字人可以支持不同的形象或者音色等，承载3D数字人的交互装置可以基于对用户身份的识别，自动为用户选择符合用户身份的3D数字人形象，或者，管理承载3D数字人的交互装置的工作人员可以自行给3D数字人选择形象。例如，以应用场景为金融场景下某银行网点为例，3D数字人的形象可以为穿着银行女性职业装等。例如，以应用场景为游乐场为例，3D数字人的形象可以为穿着卡通服装等。例如，以应用场景为园区为例，3D数字人的形象可以为穿着便装等。这里，本公开实施例对此不做限定。

例如，该3D数字人可与用户进行语音互动，可具备人脸身份识别能力，可具有专业领域知识技能，可根据用户的问题进行专业知识解答及智能化内容推荐。

在一种示例性实施例中，在不同的应用场景中，服务类型可以不同。举例来说，在金融应用场景(例如，某银行网点应用场景)中，服务可以包括但不限于为：某银行网点的3D导览(例如，网点内多个业务点的空间位置及业务功能介绍)、知识解答(例如，解答用户问题或者提供帮助信息等)、内容推荐(例如，金融产品介绍、金融知识介绍或者扶贫产品推荐等)和网点迎宾等。又举例来说，在园区应用场景中，服务可以包括但不限于为：园区的3D导览(例如，园区内多个楼宇的空间位置及功能介绍)和知识解答(例如，解答用户问题、提供帮助信息等)。又举例来说，在商场应用场景中，服务可以包括但不限于为：商场的3D导览(例如，商场内多个店铺的空间位置及说明)、知识解答(例如，解答用户问题、提供帮助信息等)和内容推荐(例如，商品介绍、或者餐食推荐等)。又举例来说，在展厅应用场景中，服务可以包括但不限于为：展厅的3D导览(例如，展厅内多个展览点的空间位置及展览类型说明)、知识解答(例如，解答用户问题或者提供帮助信息等)、内容推荐(例如，展览品介绍、艺术知识介绍或者艺术家介绍等)和展厅迎宾等 _。

在一种示例性实施例中，至少一个服务可以包括但不限于为：3D导览服务、内容推荐服务和问答服务中任意一种。对应地，至少一个服务对应的标识信息可以包括但不限于为：与3D导览服务对应的第一标识信息、与内容推荐服务对应的第二标识信息和与问答服务对应的第三标识信息中任意一种或多种。对应地，目标服务可以包括但不限于为：3D导览服务、内容推荐服务和问答服务中任意一种。对应地，目标标识信息可以包括但不限于为：用于表征3D导览服务的第一标识信息、用于表征内容推荐服务的第二标识信息和用于表征问答服务的第三标识信息中任意一种。对应地，目标服务界面可以包括但不限于为：3D导览界面、内容推荐界面和问答界面中任意一种。这里，本公开实施例对此不做限定。

在一种示例性实施例中，至少一个服务对应的标识信息可以包括但不限于采用：按钮或者图标等可视的界面元素来实现。其中，可视的界面元素可以包括：能够唯一标示服务的文字信息或者图片信息等。

在一种示例性实施例中，第一选择操作可以包括但不限于采用：语音操作或者触控操作等方式。举例来说，以至少一个服务对应的标识信息采用带有名称信息的按钮为例，在用户需要选择某项服务时，用户可以通过语音操作(例如，说出该按钮所显示的名称信息)，或者，用户可以通过触控操作 (例如，点击该按钮)等选择某一项服务对应的标识信息，实现与提供3D数字人的交互装置进行交互，以便提供3D数字人的交互装置给用户提供所选择的服务。这里，本公开实施例对此不做限定。

在一种示例性实施例中，在不同的目标服务中，在目标显示界面中所显示的与目标服务对应的目标显示对象不同。例如，目标服务为3D导览服务时，目标显示对象可以包括但不限于现实场景的3D场景模型。例如，目标服务为内容推荐服务时，目标显示对象可以包括但不限于3D列表。这里，本公开实施例对此不做限定。

如此，本公开实施例所提供的交互方法，在给用户提供服务的过程中，根据用户针对首页界面中所显示的至少一个服务对应的标识信息中与目标服务对应的目标标识信息的第一选择操作，基于目标标识信息，通过在目标服务界面中显示与目标服务对应的目标显示对象，可以使得用户及时获取到所需信息，并且，通过在目标服务界面中可以渲染出的3D数字人，并控制3D数字人可以执行与目标服务对应的类似于人类的动作，能够实现逼真、拟人的交互效果，能够让用户可以感觉到类似于真实人为其服务的感受，可以使得交互过程更加立体生动更加有趣。从而，可以有效提升用户的交互体验。

在一种示例性实施例中，以目标服务为3D导览服务为例，步骤13可以包括以下步骤201至步骤202：

步骤201：当目标服务为3D导览服务时，在3D导览界面的第一区域中显示现实场景的3D场景模型；其中，3D场景模型可以包括：现实场景内设置的多个空间区域对应的位置信息和说明信息；

步骤202：在3D导览界面的第二区域中显示处于执行第一预设动作的状态的3D数字人，控制3D数字人对现实场景内设置的多个空间区域进行介绍；其中，第一预设动作至少可以包括：与多个空间区域所处的位置匹配的肢体动作；第二区域位于第一区域一侧，3D数字人在3D导览界面中的景深信息小于3D场景模型在3D导览界面中的景深信息。

在一种示例性实施例中，现实场景的3D场景模型可以为使用3D建模技术，塑造的真实现实场景的真实比例还原的3D虚拟场景。例如，现实场景的3D场景模型可以为CAD(Computer Aided Design，计算机辅助设计)模型。例如，3D建模技术可以使用3dsMax、AutoCAD等建模软件，创造真实比例关系的数字模型，用于软件系统渲染展示。

在一种示例性实施例中，以应用场景为金融场景下某银行网点为例，那么，现实场景的3D场景模型可以为银行网点的3D模型，银行网点的3D模型可以为使用3D建模技术，塑造的以真实银行网点的真实比例还原的3D虚拟银行网点。例如，银行网点的3D模型可以包括：银行网点内多个业务区域对应的位置信息以及多个业务区域对应的业务说明信息。或者，以应用场景为校园为例，那么，现实场景的3D场景模型可以为校园的3D模型，校园的3D模型可以为使用3D建模技术，塑造的以真实校园的真实比例还原得到的3D虚拟校园。例如，校园的3D模型可以包括：校园内多个楼宇对应的位置信息以及多个楼宇对应的说明信息(例如，办公楼、教学楼、宿舍楼、实验楼、食堂、体育馆等)。这里，本公开实施例对此不做限定。

在一种示例性实施例中，以应用场景为金融场景下某银行网点为例，第一预设动作至少可以包括：与每一个业务区域(例如，银行网点内业务区域)所处的空间位置匹配的肢体动作。例如，肢体动作可以包括但不限于为斜上举手、平举或者斜下挥手等不同幅度的抬手动作。这里，本公开实施例对此不做限定。

例如，以应用场景为金融场景下某银行网点为例，如图2A所示，3D导览界面可以包括：银行网点的3D模型在3D导览界面中所占的整个区域(例如，第一区域21)和3D数字人在3D导览界面中所占的整个区域(例如，第二区域22)。

例如，以应用场景为金融场景下某银行网点为例，如图2B所示，银行网点的3D模型在3D导览界面中所占的第一区域21可以划分成沿第一方向DR1依次设置的第一子区域(上部子区域)211、第二子区域(中部子区域)212和第三子区域(下部子区域)213共三个网格子区域。例如，第一子区域(上部子区域)211可以对应于3D数字人抬手动作中的斜上举手动作，第二子区域(中部子区域)212可以对应于3D数字人抬手动作中的平举动作，和第三子区域(下部子区域)213可以对应于3D数字人抬手动作中的斜下挥手动作。例如，在实际应用中，不同的业务子区域所处的空间位置可以归属于不同的网格子区域，如图2B所示，母婴室、理财(代销)专区以及贵宾客户服务区可以归属于第一子区域(上部子区域)211，非现金业务区、现金业务区、便民服务区、客户等候区、咨询引导区以及电子银行服务区可以归属于第二子区域(中部子区域)212，公共教育区、爱心驿站以及24小时自助银行服务区可以归属于第三子区域(下部子区域)213。例如，在3D数字人未浸入银行网点的3D模型的情况下，讲解母婴室功能时，3D数字人可以执行上抬手的动作，指向第一子区域(上部子区域)211，讲解便民服务区时，3D数字人可以执行平举手动作，指向第二子区域(中部子区域)212；讲解爱心驿站时，3D数字人可以执行下举手动作，指向第三子区域(下部子区域)213。如此，在提供3D导览服务时，在3D数字人给用户介绍不同的业务区域时，可以控制3D数字人执行与业务区域所处的空间位置所归属的网格区域对应的抬手动作。这里，本公开实施例对此不做限定。

例如，以应用场景为金融场景下某银行网点为例，如图2B所示，银行网点的3D模型在3D导览界面中所占的第一区域21还可以划分成沿第二方向DR2依次设置的第四子区域(左部子区域)214、第五子区域(第二中部子区域)215和第六子区域(右部子区域)216，如此，可以形成3*3共9个子区域，可以对应于更加精细化的手部动作指引。其中，第二方向DR2与第一方向DR1交叉(例如，第二方向DR2与第一方向DR1相垂直)。例如，第四子区域(左部子区域)214可以对应于3D数字人伸出第一长度的抬手动作，第五子区域(第二中部子区域)215可以对应于3D数字人伸出第二长度抬手动作，第六子区域(右部子区域)216可以对应于3D数字人伸出第三长度抬手动作。例如，在实际应用中，不同的业务子区域所处的空间位置可以归属于不同的网格子区域，如图2B所示，母婴室、非现金业务区、便民服务区、客户等候区、公共教育区、以及爱心驿站可以归属于第四子区域(左部子区域)214，理财(代销)专区、贵宾客户服务区、现金业务区、以及咨询引导区可以归属于第五子区域(中部子区域)215，电子银行服务区以及24小时自助银行服务区可以归属于第六子区域(右部子区域)216。如此，在提供3D导览服务时，在3D数字人给用户介绍不同的业务区域时，可以控制3D数字人执行与业务区域所处的空间位置所归属的网格区域对应的伸出不同长度的抬手动作。这里，本公开实施例对此不做限定。

在一种示例性实施例中，在3D数字人基于现实场景的3D场景模型，对现实场景内设置的不同的空间区域进行介绍时，每一个空间区域可以采用高亮方式进行显示，同时，每一个空间区域可以有一个具有说明信息的可视的界面元素，如Tag(标签)。其中，用户可以触控操作点击Tag，或者语音选择(说出该Tag的名称，关键词匹配的方式语音选择该Tag)。

在一种示例性实施例中，在3D导览界面中第二区域与第一区域之间可以存在交叠区域，或者，可以不存在交叠区域，这里，本公开实施例对此不做限定。

在一种示例性实施例中，在步骤202之后，该交互方法还可以包括以下步骤：

步骤203：接收针对多个空间区域对应的说明信息中与目标空间区域对应的目标说明信息的第二选择操作；

步骤204：响应于第二选择操作，在3D导览界面中显示放大后的3D场景模型；

步骤205：在放大后的3D场景模型中目标空间区域的周围区域中显示缩小后的3D数字人，控制缩小后的3D数字人对目标空间区域进行介绍；其中，缩小后的3D数字人在3D导览界面中的景深信息等于目标业务区域在3D导览界面中的景深信息。

如此，通过将3D数字人显示在现实场景的3D场景模型中，即3D数字人浸入到3D场景模型中，来给用户详细讲解现实场景内设置的不同空间区域(例如，银行网点的业务区域)，能够为用户提供沉浸式的3D导览服务，能够提升数据可视化展示效果，可以给用户一种身临其境到现实场景内设置的空间区域(例如，银行网点的业务区域)的感觉。从而，可以有效提升用户的交互体验。

在一种示例性实施例中，第二选择操作可以包括但不限于采用：语音操作或者触控操作等。举例来说，以多个空间区域对应的说明信息采用带有名称信息的标签(Tag)为例，在用户需要选择某个空间区域时，用户可以通过语音操作(例如，说出该标签所显示的名称信息)，或者，用户可以通过触控操作(例如，点击该标签)等选择目标空间区域对应的目标说明信息，实现与提供3D数字人的交互装置进行交互。这里，本公开实施例对此不做限定。

在一种示例性实施例中，步骤205可以包括：控制缩小后的3D数字人以现实场景的3D场景模型中目标空间区域为起点，在放大后的3D场景模型中进行漫游，按照预设顺序，对现实场景内设置的多个空间区域进行逐个讲解。

在一种示例性实施例中，在步骤205之后，该交互方法还可以包括：步骤206：响应于用于旋转3D场景的视角的触控操作，在3D导览界面中根据触控操作对应的触控信息(例如，旋转角度)旋转3D场景模型的视角。如此，用户可以采用触控操作的方式旋转3D场景模型的视角，任意观看每一个位置。此外，在用户旋转3D场景模型的视角的过程中，该交互方法还可以包括：控制3D数字人做出相应的动作及语音提示。如此，能够提供丰富的交互自由度，从而，能够有效提升交互体验。

例如，与图2A所示的3D导览界面相比，图2C所示的3D导览界面可以包括：放大后的银行网点的3D模型在3D导览界面中所占的整个区域，而缩小后的3D数字人显示在银行网点的3D模型中。

例如，用户语音说出“沉浸式讲解”，可以切换模式，从未浸入时的人大场景小(3D数字人为主导)，变为浸入式的场景放大，人变小。例如，如图2D所示，缩小后的3D数字人在银行网点的3D模型中可以进行漫游，按照预设顺序对不同的业务区域进行介绍。例如，如图2D所示，在浸入式3D导览模式下，用户采用语音操作，询问业务区域，3D数字人可以会移动漫游到不同的业务点位进行讲解，其中，在图2D中黑色箭头示出了3D数字人的移动漫游轨迹。例如，用户采用语音操作，询问“电子银行服务”时，3D数字人可以移动到电子银行服务区处，开始介绍该区域的功能。这里，本公开实施例对此不做限定。

在一种示例性实施例中，以目标服务为内容推荐服务为例，步骤13可以包括以下步骤301至步骤302：

步骤301：当目标服务为内容推荐服务时，在3D推荐界面的第一区域中显示3D列表；其中，3D列表包括：与现实场景提供的多个推荐内容一一对应的多个卡片；

步骤302：在3D推荐界面的第二区域中显示处于执行第二预设动作的状态的3D数字人，控制3D数字人基于多个卡片，对现实场景提供的多个推荐内容进行介绍；其中，第二区域位于第一区域一侧，3D数字人在3D推荐界面中的景深信息小于3D列表在3D推荐界面中的景深信息。

在一种示例性实施例中，根据不同的应用场景，3D列表中所包括的推荐内容不同。例如，以应用场景为金融场景下某银行网点为例，现实场景提供的多个推荐内容可以包括但不限于为：银行网点提供的多个金融产品或者扶贫商品，那么，3D列表可以包括：银行网点提供的多个金融产品一一对应的多个卡片。例如，以应用场景为展厅为例，现实场景提供的多个推荐内容可以包括但不限于为：展厅展示的多个展品(例如，艺术片)，那么，3D列表可以包括：展厅展示的多个展品一一对应的多个卡片。例如，以应用场景为园区为例，现实场景提供的多个推荐内容可以包括但不限于为：园区内的多个楼宇。例如，以应用场景为景区为例，现实场景提供的多个推荐内容可以包括但不限于为：景区内的多个景点等。这里，本公开实施例对此不做限定。

在一种示例性实施例中，步骤302可以包括：

步骤3021：从与多个推荐内容一一对应的多个卡片中，获取待推荐的目标推荐内容对应的目标卡片；

步骤3022：对于目标卡片进行放大处理，获得放大后的目标卡片；

步骤3023：在3D推荐界面中将放大后的目标卡片显示在3D数字人与3D列表之间，控制3D数字人在执行第二预设动作的同时对目标推荐内容进行介绍；其中，放大后的目标卡片在3D推荐界面中的景深信息大于3D数字人在3D推荐界面中的景深信息，且小于3D列表在3D推荐界面中的景深信息。

在一种示例性实施例中，步骤3023可以包括：获取目标推荐内容对应的介绍信息；其中，介绍信息可以包括：第一语音信息和第一文字信息；在放大后的目标卡片中展示第一文字信息；控制3D数字人在播放第一语音信息的同时，执行第二预设动作，以实现对目标推荐内容进行介绍；其中，第二预设动作可以包括：与第一语音信息对应的唇部动作、肢体动作和眼部动作中的任意一种或多种。

例如，以应用场景为金融场景下某银行网点为例，3D推荐界面可以包括：3D列表在3D推荐界面中所占的第一区域和3D数字人在3D导览界面中所占的第二区域。其中，3D列表可以包括：银行网点提供的多个金融产品一一对应的多个卡片。接下来，在对银行网点提供的金融产品进行介绍的过程中，如图3所示，当前正在被介绍的金融产品所对应的目标卡片312(即目标推荐内容对应的目标卡片)可以在3D推荐界面中放大显示，并且，将放大后的目标卡片显示在3D数字人与3D列表之间，即3D数字人311、单个的目标卡片312、3D列表313介绍依次按照景深信息由小到大分布。如此，能够提升数据可视化展示效果。从而，可以有效提升用户的交互体验。

例如，3D列表可以出现在3D空间中，悬浮在空气中(类似虚空成像)；或者，可以出现在3D场景的背景墙上，作为一个显示屏的画面出现，营造一种3D数字人在对着墙上的显示屏画面在实时播报的情景；然后介绍单个产品的时候，产品可以从3D列表中飞出来进行呈现。

在一种示例性实施例中，以目标服务为问答服务为例，步骤13可以包括以下步骤401至步骤404：

步骤401：当目标服务为问答服务时，获取用户通过语音操作输入的提问信息；

步骤402：基于提问信息，获取对应的应答结果；其中，应答结果可以包括：第二文字信息和第二语音信息；

步骤403：在问答界面的第一区域中显示第二文字信息；

步骤404：在问答界面的第二区域中显示处于执行第三预设动作的状态的3D数字人，控制3D数字人播放第二语音信息，以实现对用户的提问进行应答；其中，第三预设动作可以包括：与第二语音信息对应的唇部动作、肢体动作和眼部动作中的任意一种或多种。

在一种示例性实施例中，在步骤401之后，该交互方法还可以包括：

步骤405：确定提问信息是否包含与3D导览服务匹配的第一预设信息或者与内容推荐服务匹配的第二预设信息；

步骤406：若确定提问信息包含第一预设信息，则从问答界面切换至3D导览界面，以提供3D导览服务；

步骤407：若确定提问信息包含第二预设信息，则从问答界面切换至3D推荐界面，以提供内容推荐服务；

步骤408：若确定提问信息不包含第一预设信息和第二预设信息，则基于提问信息，获取对应的应答结果。

如此，在提供问答服务的过程中，若涉及到3D导览服务可以直接切换至对应的3D导览界面，以便采用3D数字人和3D场景模型联合的可视化方式，有针对性地为用户提供更为优质的展示效果更好的3D导览服务。或者，在提供问答服务的过程中，若涉及到内容推荐服务，可以直接切换至对应的3D推荐界面，以便采用3D数字人和3D列表联合的可视化方式，有针对性地为用户提供更为优质的展示效果更好的内容推荐服务。从而，可以有效地提升用户的交互体验。

在一种示例性实施例中，在步骤11之前，该交互方法还可以包括：

步骤501：在显示处于静默状态下的3D数字人的过程中，获得用户的图像信息；

步骤502：确定用户的图像信息是否满足用于指示唤醒3D数字人的预设条件；

步骤503：若确定用户的状态为用于指示唤醒3D数字人的预设状态，将3D数字人唤醒，获取用于表示欢迎用户的问候信息；其中，问候信息可以包括：第三文字信息和第三语音信息；

步骤504：在首页界面中第三文字信息；

步骤505：在首页界面中，控制3D数字人播放第三语音信息的同时，执行第四预设动作，以实现对用户进行打招呼；其中，第四预设动作可以包括：与第三语音信息对应的唇部动作和用于表示欢迎用户的肢体动作。

如此，可以设置3D数字人具有静默状态，从而，可以减少承载3D数字人的电子设备的功耗。并且，在3D数字人处于静默状态下，通过用户的图像信息来唤醒3D数字人，从而，无需用户进行操作即可及时地唤醒3D数字人，还可以实现高效地确定触发3D数字人与用户的交互，可以提升用户的交互体验。

在一种示例性实施例中，用于表示欢迎用户的问候信息可以为预先设置的默认问候信息(例如，默认的“您好”)，或者，可以为智能化合成的个性问候信息(例如，可以为根据用户的性别信息、年龄信息和身份信息中的一种或多种所设定的个性化问候信息)。这里，本公开实施例对此不做限定。

在一种示例性实施例中，3D数字人执行的用于表示欢迎用户的肢体动作可以为鞠躬动作，3D数字人通过弯腰向用户鞠躬，对用户表示出“欢迎”的意思。或者，3D数字人执行的用于表示欢迎用户的肢体动作可以为微笑动作，对用户表示出“欢迎”的意思。3D数字人执行的与第三语音信息对应的唇部动作可以为对应于“您好”的唇动动作，表示出对用户表示“欢迎”的意思。这里，本公开实施例对此不做限定。

在一种示例性实施例中，步骤502中用于指示唤醒3D数字人的预设条件，可以包括：用户的图像信息表明用户朝向靠近3D虚拟人所在电子设备的方向运动，或者，用户的人脸区域在用户的图像信息中所占的比例满足预设阈值。如此，通过设置所获取到的用户的图像信息满足一定的预设条件才唤醒3D数字人，可以避免用户距离很远时误检测过路人等情况，从而，可以实现高效准确地唤醒3D数字人与用户之间的交互。

在一种示例性实施例中，步骤503可以包括：

步骤5031：对用户的图像信息进行分析，提取用户的特征信息；其中，用户的特征信息可以包括：性别信息、年龄信息和身份信息中的任意一种或多种；

步骤5032：基于用户的特征信息，获取用于表示欢迎用户的问候信息。如此，通过从用户的图像信息提取的用户的特征信息，来给不同用户提供个性化的唤醒服务。从而，能够提供更好的交互体验。

在一种示例性实施例中，以应用场景为金融场景下某银行网点为例，身份信息可以包括但不限于：非贵宾(vip)和贵宾(vip)。这里，本公开实施例对此不做限定。

举例来说，针对年龄为16岁以下、性别为女性、且身份为非贵宾(vip)的用户，用于表示欢迎用户的问候信息可以采用：对应于“你好，小姑娘，欢迎来到***网点”的文字信息和语音信息。或者，针对年龄为30岁以上、性别为男性、且身份为非贵宾(vip)的用户，用于表示欢迎用户的问候信息可以采用：对应于“先生您好，欢迎来到***网点”的文字信息和语音信息。或者，针对身份为贵宾(vip)的用户，用于表示欢迎用户的问候信息可以采用：对应于“尊敬的xx先生/女士，您好，欢迎来到***网点”的文字信息和语音信息。这里，本公开实施例对此不做限定。

下面以应用场景为金融场景下某银行网点为例，对本公开实施例所提供的交互方法进行说明。

图4为本公开示例性实施例中的交互方法的应用场景的示意图。如图4所示，交互系统可以包括：交互装置和与交互装置连接的AIOT(人工智能技术与物联网)云平台。其中，交互装置可以包括但不限于：3D数字人模块41、UI模块42、智能语音模块43、智能人脸识别模块44、消息总线模块45和3D导览模块46。该交互装置还可以包括：物联网(Internet of Things，IOT)设备，例如，麦克风阵列和摄像头等。这里，本公开实施例对此不做限定。

其中，云平台，可以是指基于硬件资源和软件资源的服务，提供计算、网络和存储能力。人工智能，AI，它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。数字化，把现实世界的物体通过计算机领域知识抽象到数字世界、再通过可视化技术呈现出来。

在一种示例性实施例中，智能语音模块可以包括但不限于：语音采集单元(例如麦克风阵列或者多个麦克风等)、语音播放单元(例如至少一个喇叭等)以及语音处理单元。其中，语音采集单元(例如麦克风阵列或者多个麦克风)，被配置为对交互装置预设范围内的周围环境中的语音信息进行监听，以便捕获用户的输入的语音信息。语音处理单元，被配置为对用户的输入的语音信息进行处理，获取用户通过语音操作输入的提问信息；根据提问信息从AIOT云平台后获取对应的应答结果(文字信息)；将对应的应答结果(文字信息)转化为对应的应答结果(语音信息)。语音播放单元，被配置为输出语音信息，以实现3D数字人的语音功能。从而，实现语音互动的功能。这里，本公开实施例对此不做限定。

在一种示例性实施例中，智能人脸识别模块可以包括但不限于：图像采集单元(例如摄像头)以及图像处理单元。其中，图像采集单元(例如摄像头)，被配置为实时捕获位于交互装置可识别区域内的用户的图像信息；图像处理单元，被配置为从用户的图像信息中提取用户的面部图像信息；对用户的面部图像信息进行分析处理，识别出用户的特征信息，例如，年龄信息、性别信息、表情信息等，或者，还可以根据预置的已经登记的贵宾(vip)客户信息，经过特征值匹配，可以识别出用户的身份信息，例如，非贵宾(vip)和贵宾(vip)，实现精准推荐的功能。这里，本公开实施例对此不做限定。

在一种示例性实施例中，交互系统中多个模块可以以消息总线模块建立联系。消息总线模块，被配置为作为消息总线负责多个模块之间的所有消息的流转，可以起到消息缓存及分发的作用。这里，本公开实施例对此不做限定。

在一种示例性实施例中，交互系统可以默认处于静默状态，当用户靠近交互系统时，智能人脸识别模块可以采集到用户的图像信息(例如，包括用户的面部信息)，当用户的图像信息满足用于指示唤醒3D数字人的预设条件后，交互系统可以被唤醒。接下来，智能人脸识别模块可以根据用户的图像信息提取出用户的特征信息(例如，包括用户的性别信息sex、年龄信息age和身份信息info)，然后信息汇总后发送一条第一消息msg1到消息总线模块，第一消息msg1会携带用户的特征信息(sex,age,info)。从而，其它模块(例如，3D数字人模块、UI模块或者智能语音模块)通过消息总线模块可以实时的收到第一消息msg1，并作出联动反应。例如，UI模块可以根据第一消息msg1中携带的用户的特征信息(sex,age,info)，展示欢迎词，例如，针对年龄为16岁以下、性别为女性、且身份为非贵宾(vip)的用户，可以展示对应于“你好，小姑娘，欢迎来到***网点”的文字信息；或者，针对年龄为30岁以上、性别为男性、且身份为非贵宾(vip)的用户，可以展示对应于“先生您好，欢迎来到***网点”的文字信息；或者，针对身份为贵宾(vip)的用户，可以展示对应于“尊敬的xx先生/女士，您好，欢迎来到***网点” 的文字信息。例如，3D数字人模块可以控制3D数字人执行弯腰、摊手等一系列表示欢迎的动作。例如，智能语音模块可以播放欢迎语音，该欢迎语音可能为来自音频池的默认欢迎词，或者可能为自语音系统的智能化合成个性欢迎词，例如，针对年龄为16岁以下、性别为女性、且身份为非贵宾(vip)的用户，可以播放对应于“你好，小姑娘，欢迎来到***网点”的语音信息；同时，智能语音模块中语音采集功能预热，智能语音模块的唤醒服务(守护进程)启动，随时准备与用户进行智能语音对话。至此，一个动作触发的一系列联动反应完结。相似的，后续的消息msg都可以触发一系列联动反应。

在一种示例性实施例中，智能语音模块可以实现语音唤醒、语音识别、语义识别、语音知识库或者语音合成等功能。例如，语音唤醒功能可以是一个可以后台运行的守护服务，或者，可以一直检测用户的语音输入，或者，可以在收到智能人脸识别模块的第一消息msg1后启动，启动后当判断匹配预置的唤醒词后，触发语音唤醒事件，例如，用户说出预置唤醒词“小E小E”，此时触发唤醒事件，语音采集单元开始录音，同时启动语音处理单元中的语音识别及语义识别，实时识别用户的语音输入，结果可以实时的通过消息总线模块发送出去第二消息msg2，其中，第二消息msg2中可以携带所识别出的提问信息(asr_text)。在UI模块收到第二消息msg2后，可以实时展示语音输入的提问信息(asr_text)，结果会不断的校正，当结束录音时(可以是主动式结束，或者可以是被动式结束，例如，点击结束录音按钮，则为主动结束，或者经过静音检测VAD判断为录音结束)开始基于提问信息检索知识库(托管在AIOT云平台)，搜索到与提问信息匹配的应答信息后，可以以应答信息对应的文字信息的形式返回，返回应答信息对应的文字信息后，可以发送第三消息msg3，其中，第三消息msg3可以包括(question,answer)数据，question表示输入的提问信息，answer表示应答信息，经过语音合成，应答信息对应的文字信息变为语音信息，播放出来，播音的时候会可以发送第四消息msg4，触发其它模块的联动。

在一种示例性实施例中，3D数字人模块可以监听消息总线模块一系列消息，从而触发3D数字人执行对应动作。例如，3D数字人模块通过消息总线模块接收到智能人脸识别模块发出的第一消息msg1，可以根据第一消息 msg1中携带用户的特征信息(sex,age,info)，控制3D数字人执行弯腰欢迎动作、或者微笑动作等。例如，3D数字人模块通过消息总线模块接收到智能语音模块发出的第四消息msg4，可以控制3D数字人执行唇动动作、眨眼动作、挥手动作等，匹配播放的语音信息。例如，3D数字人模块通过消息总线模块接收到3D导览模块发出的第五消息msg5，可以控制3D数字人执行走路动作、或者抬手动作等；例如，3D数字人模块通过消息总线模块接收到3D导览模块发出的第六消息msg6，可以根据第六消息msg6中携带的标签名称信息(TagName)所对应的带有名称信息的标签(Tag)所在逻辑网格区域，而选择控制3D数字人执行对应的抬手动作(斜高举手、平举、斜下挥手)等。如此，可避免3D数字人被动的反复执行相同的动作导致交互单一刻板的问题，且由于可控制数字人输出与用户进行交互的交互动作，因此，可以使人机交互更加具有灵活性和多样性，从而可以增强互动的效果，进而提高用户的交互体验。

在一种示例性实施例中，UI模块，被配置为负责所有的UI展示(例如，静默状态界面、首页界面、3D导览界面、内容推荐界面或者问答界面等)及切换，还被配置为会负责从AIOT云平台获取更详细的产品等信息进行3D列表化展示。例如，UI模块初始显示静默状态界面，静默状态界面中可以显示处于静默状态下的3D数字人，可能显示一些默认产品推荐的海报轮播等。例如，UI模块通过消息总线模块接收到智能人脸识别模块发出的第一消息msg1，可以根据第一消息msg1，将界面切换为首页界面。例如，UI模块通过消息总线模块接收到收到第三消息msg3，其中，第三消息msg3可以包括(question,answer)数据，question表示输入的提问信息，answer表示应答信息，可以将界面切换至为问答界面，展示提问信息对应的应答信息，还可能会进一步的使用提问信息去AIOT云平台获取更进一步的详细的产品信息，其中，应答信息可能是一个比较简短精炼的文字信息，详细信息可以更丰富(例如，包括图文信息等)，然后以3D UI列表的形式进行产品信息展示呈现。

在一种示例性实施例中，3D导览模块，被配置为生成现实场景的3D场景模型。例如，以应用场景为金融场景下某银行网点为例，那么，现实场景的3D场景模型可以为银行网点的3D模型，银行网点的3D模型可以包括：银行网点内多个业务区域对应的位置信息以及多个业务区域对应的业务说明信息。例如，UI模块将界面切换至3D导览界面后，3D导览模块可以发出第五消息msg5，而且，如图2A所示，3D数字人移动到界面的一侧，另一侧出现银行网点的3D模型(此时3D模型视角为常规状态)，3D数字人侧身抬手，宏观介绍该网点的主要业务区域位每一个主要业务区域都会高亮，可以选中进行讲解，同时每个高亮业务区域有一个具名的Tag，可以点击Tag或者语音选择(说出该Tag的名称，关键词匹配的方式语音选择该菜单)，选中某一个点位，进行宏观讲解时，会发送第六消息msg6(TagName)，触发3D数字人抬手动作等；用户选中某一个点位进行漫游讲解时，此时，如图2D所示，银行网点的3D模型放大(此时3D模型视角为沉浸式的漫游状态)，3D数字人浸入到银行网点的3D模型中，详细讲解该业务点位的功能，给用户一种身临其境到网点业务点位的感觉，而且此时用户可以触屏的方式旋转场景视角，任意观看每一个位置，3D数字人会做出相应的动作及语音提示，丰富的交互自由度可以提升交互体验；3D数字人还可在场景中漫游，在各个业务点位逐个讲解。

以上应用场景实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开应用场景实施例中未披露的技术细节，本领域的技术人员请参照本公开方法实施例中的描述而理解，这里不再赘述。

需要说明的是，图4仅是本公开示例性实施例适用的应用场景的一个示例，这里，对本公开示例性实施例所提供的交互方法的应用场景不做限定。

本公开实施例还提供一种电子设备。该电子设备可以包括：显示屏、处理器以及存储有可在处理器上运行的计算机程序的存储器，其中，处理器执行计算机程序时实现上述一个或多个示例性实施例中的交互方法的步骤。

在一种示例性实施例中，如图5所示，该电子设备50可以包括：至少一个处理器51；以及与处理器51连接的至少一个存储器52、总线53、以及显示屏(图中未示出)；其中，处理器51、存储器52、显示屏(图中未示出) 通过总线53完成相互间的通信；处理器51用于调用存储器52中的程序指令，以执行上述一个或多个实施例中的交互方法的步骤。

在一种示例性实施例中，上述处理器可以是中央处理单元(Central Processing Unit，CPU)、其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件、专用集成电路等。通用处理器可以是微处理器(Micro Processor Unit，MPU)或者，该处理器可以是任何常规的处理器等。这里，本公开实施例对此不做限定。

在一种示例性实施例中，存储器可能包括计算机可读存储介质中的非永久性存储器，随机存储器(Random Access Memory，RAM)和/或非易失性内存等形式，如只读存储器(Read Only Memory，ROM)或闪存(Flash RAM)，存储器包括至少一个存储芯片。这里，本公开实施例对此不做限定。

在一种示例性实施例中，总线除了可以包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图5中将各种总线都标为总线53。这里，本公开实施例对此不做限定。

在一种示例性实施例中，显示屏可以包括但不限于采用液晶显示面板、有机发光二极管显示面板或者量子点发光二极管显示面板等。这里，本公开实施例对此不做限定。

在实现过程中，电子设备所执行的处理可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。即本公开实施例的方法步骤可以体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

在一种示例性实施例中，该电子设备可以包括但不限于为：手机、平板电脑、电视机、显示器、笔记本电脑或者机器人等能提供3D数字人且包括用户界面的产品或部件。这里，本公开实施例对电子设备的类型不做限定。对于该电子设备的其它必不可少的组成部分均为本领域的普通技术人员应该理解具有的，在此不做赘述，不应作为对本公开的限制。

本公开实施例还提供一种计算机可读存储介质，包括存储的程序，其中，在程序运行时控制存储介质所在的设备执行上述一个或多个实施例中的交互方法的步骤。

在一种示例性实施例中，上述计算机可读存储介质可以包括但不限于采用：ROM/RAM、磁碟或者光盘等。这里，本公开实施例对此不做限定。

以上电子设备或计算机可读存储介质实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开电子设备或计算机可读存储介质实施例中未披露的技术细节，本领域的技术人员请参照本公开方法实施例的描述而理解。在此不再赘述。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

虽然本公开所揭露的实施方式如上，但上述的内容仅为便于理解本公开而采用的实施方式，并非用以限定本公开。任何本公开所属领域内的技术人员，在不脱离本公开所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本公开的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

一种交互方法，包括：

在首页界面中显示至少一个服务对应的标识信息；

接收针对所述至少一个服务对应的标识信息中与目标服务对应的目标标识信息的第一选择操作；

响应于所述第一选择操作，基于所述目标标识信息，在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的目标显示对象。
根据权利要求1所述的方法，其中，所述至少一个服务对应的标识信息包括：与3D导览服务对应的第一标识信息、与内容推荐服务对应的第二标识信息和与问答服务对应的第三标识信息中任意一种或多种。
根据权利要求1或2所述的方法，其中，所述在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的所述目标显示对象，包括：

当所述目标服务为3D导览服务时，在3D导览界面的第一区域中显示现实场景的3D场景模型；其中，所述3D场景模型包括：所述现实场景内设置的多个空间区域对应的位置信息和说明信息；

在3D导览界面的第二区域中显示处于执行第一预设动作的状态的3D数字人，控制所述3D数字人对所述现实场景内设置的多个空间区域进行介绍；其中，所述第一预设动作至少包括：与多个空间区域所处的位置匹配的肢体动作；所述第二区域位于所述第一区域一侧，所述3D数字人在3D导览界面中的景深信息小于所述3D场景模型在所述3D导览界面中的景深信息。
根据权利要求3所述的方法，还包括：

接收针对所述多个空间区域对应的说明信息中与目标空间区域对应的目标说明信息的第二选择操作；

响应于所述第二选择操作，在3D导览界面中显示放大后的3D场景模型；

在所述放大后的3D场景模型中所述目标空间区域的周围区域中显示缩小后的3D数字人，控制缩小后的3D数字人对所述目标空间区域进行介绍；其中，所述缩小后的3D数字人在3D导览界面中的景深信息等于所述目标业务区域在3D导览界面中的景深信息。
根据权利要求1或2所述的方法，其中，所述在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的所述目标显示对象，包括：

当所述目标服务为内容推荐服务时，在3D推荐界面的第一区域中显示3D列表；其中，所述3D列表包括：与现实场景提供的多个推荐内容一一对应的多个卡片；

在3D推荐界面的第二区域中显示处于执行第二预设动作的状态的3D数字人，控制3D数字人基于所述多个卡片，对现实场景提供的多个推荐内容进行介绍；其中，所述第二区域位于所述第一区域一侧，所述3D数字人在所述3D推荐界面中的景深信息小于所述3D列表在所述3D推荐界面中的景深信息。
根据权利要求5所述的方法，其中，所述控制3D数字人基于所述多个卡片，对现实场景提供的多个推荐内容进行介绍，包括：

从与所述多个推荐内容一一对应的多个卡片中，获取待推荐的目标推荐内容对应的目标卡片；

对于所述目标卡片进行放大处理，获得放大后的目标卡片；

在3D推荐界面中将放大后的目标卡片显示在所述3D数字人与所述3D列表之间，控制所述3D数字人在执行第二预设动作的同时对所述目标推荐内容进行介绍；其中，所述放大后的目标卡片在3D推荐界面中的景深信息大于所述3D数字人在3D推荐界面中的景深信息，且小于所述3D列表在3D推荐界面中的景深信息。
根据权利要求6所述的方法，其中，所述控制所述3D数字人在执行第二预设动作的同时对所述目标推荐内容进行介绍，包括：

获取所述目标推荐内容对应的介绍信息；其中，所述介绍信息包括：第一语音信息和第一文字信息；

在所述放大后的目标卡片中展示所述第一文字信息；

控制所述3D数字人在播放所述第一语音信息的同时，执行所述第二预设动作，以实现对所述目标推荐内容进行介绍；其中，所述第二预设动作包括：与所述第一语音信息对应的唇部动作、肢体动作和眼部动作中的任意一种或多种。
根据权利要求1或2所述的方法，其中，所述在目标服务界面显示处于执行与所述目标服务对应的动作的状态的3D数字人以及与所述目标服务对应的所述目标显示对象，包括：

当所述目标服务为问答服务时，获取用户通过语音操作输入的提问信息；

基于所述提问信息，获取对应的应答结果；其中，所述应答结果包括：第二文字信息和第二语音信息；

在问答界面的第一区域中显示所述第二文字信息；

在问答界面的第二区域中显示处于执行第三预设动作的状态的3D数字人，控制3D数字人播放所述第二语音信息，以实现对用户的提问进行应答；其中，所述第三预设动作包括：与所述第二语音信息对应的唇部动作、肢体动作和眼部动作中的任意一种或多种。
根据权利要求8所述的方法，其中，在所述获取用户通过语音操作输入的提问信息之后，所述方法还包括：

确定所述提问信息是否包含与3D导览服务匹配的第一预设信息或者与内容推荐服务匹配的第二预设信息；

若确定所述提问信息包含所述第一预设信息，则从所述问答界面切换至3D导览界面，以提供3D导览服务；

或者，若确定所述提问信息包含所述第二预设信息，则从所述问答界面切换至3D推荐界面，以提供内容推荐服务；

或者，若确定所述提问信息不包含所述第一预设信息和所述第二预设信息，则基于所述提问信息，获取对应的应答结果。
根据权利要求1所述的方法，其中，在所述在首页界面中显示至少一个服务对应的标识信息之前，所述方法还包括：

在显示处于静默状态下的所述3D数字人的过程中，获得用户的图像信息；

确定所述用户的图像信息是否满足用于指示唤醒所述3D数字人的预设条件；

若确定所述用户的状态为用于指示唤醒所述3D数字人的预设状态，将所述3D数字人唤醒，获取用于表示欢迎所述用户的问候信息；其中，问候信息包括：第三文字信息和第三语音信息；

在所述首页界面中第三文字信息；

在所述首页界面中，控制所述3D数字人播放第三语音信息的同时，执行第四预设动作，以实现对用户进行打招呼；其中，所述第四预设动作包括：与第三语音信息对应的唇部动作和用于表示欢迎所述用户的肢体动作。
根据权利要求10所述的方法，其中，所述用于指示唤醒所述3D数字人的预设条件，包括：所述用户的图像信息表明所述用户朝向靠近所述3D虚拟人所在电子设备的方向运动，或，所述用户的人脸区域在所述用户的图像信息中所占的比例满足预设阈值。
根据权利要求10所述的方法，其中，所述获取用于表示欢迎所述用户的问候信息，包括：

对所述用户的图像信息进行分析，提取所述用户的特征信息；其中，所述用户的特征信息包括：性别信息、年龄信息和身份信息中的任意一种或多种；

基于所述用户的特征信息，获取所述用于表示欢迎所述用户的问候信息。
一种电子设备，包括：处理器以及存储有可在处理器上运行的计算机程序的存储器，其中，所述处理器执行所述程序时实现如权利要求1至12任一项所述的交互方法的步骤。
一种计算机可读存储介质，包括存储的程序，其中，在所述程序运行时控制所述存储介质所在的设备执行如权利要求1至12任一项所述的交互方法的步骤。