CN111182387B - 一种学习互动方法及智能音箱 - Google Patents
一种学习互动方法及智能音箱 Download PDFInfo
- Publication number
- CN111182387B CN111182387B CN201911222628.5A CN201911222628A CN111182387B CN 111182387 B CN111182387 B CN 111182387B CN 201911222628 A CN201911222628 A CN 201911222628A CN 111182387 B CN111182387 B CN 111182387B
- Authority
- CN
- China
- Prior art keywords
- page image
- virtual
- learning
- audio
- displaying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/275—Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/293—Generating mixed stereoscopic images; Generating mixed monoscopic and stereoscopic images, e.g. a stereoscopic image overlay window on a monoscopic image background
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Abstract
一种学习互动方法及智能音箱,该方法包括:当安装于智能音箱上到的可翻转摄像装置翻转至第一预设位置时,利用该摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;识别页面图像中的学习内容所属的学习项目;在智能音箱的显示屏幕上显示页面图像,并且在页面图像上叠加显示与学习项目对应的增强现实对象。实施本申请实施例,能够提高学习效果。
Description
技术领域
本申请涉及增强现实技术领域,具体涉及一种学习互动方法及智能音箱。
背景技术
做作业是巩固知识、加深学习记忆的一种常用手段。但是,部分学生在做作业的时候,容易感到枯燥,所以常常分神开小差,导致学习效果较差,没有达到通过做作业进行知识复习的目的。因此,亟需开发一种可以调动学生做作业的积极性的学习辅导方法。
发明内容
本申请实施例公开了一种学习互动方法及智能音箱,可以提高学习效果。
本申请实施例第一方面公开一种学习互动方法,
所述方法应用于包含可翻转摄像装置的智能音箱,所述方法包括:
控制翻转至第一预设位置的所述摄像装置拍摄与所述智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于所述第一预设位置的所述摄像装置的摄像孔朝向所述放置面;
识别所述页面图像中的学习内容所属的学习项目;
在所述智能音箱的显示屏幕上显示所述页面图像,并且在所述页面图像上叠加显示与所述学习项目对应的增强现实对象。
作为一种可选的实施方式,在本申请实施例第一方面中,若所述学习项目为阅读练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
依据所述学习内容构建虚拟场景;
控制所述摄像装置翻转至第二预设位置;其中,处于所述第二预设位置的所述摄像装置的摄像孔朝向所述显示屏幕的前方;
控制所述摄像装置拍摄人脸图像,并依据所述人脸图像生成第一虚拟卡通人物;
将所述第一虚拟卡通人物添加至所述虚拟场景,并将添加所述第一虚拟卡通人物的所述虚拟场景在所述页面图像中叠加显示。
作为一种可选的实施方式,在本申请实施例第一方面中,若所述学习项目为立体几何练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
识别所述学习内容中的印刷几何体和手写辅助线;
生成所述印刷几何体的三维虚拟模型,并依据所述手写辅助线和所述印刷几何体的位置关系,在所述三维虚拟模型中添加所述手写辅助线对应的三维虚拟线段,得到目标虚拟模型;
在所述页面图像中叠加显示所述目标虚拟模型。
作为一种可选的实施方式,在本申请实施例第一方面中,若所述学习项目为口语练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
获取与用户对话的第二虚拟卡通人物;
依据所述学习内容确定所述第二虚拟卡通人物的回复音频,并综合所述第二虚拟卡通人物和每一所述回复音频,得到每一所述回复音频对应的虚拟动画;
检测是否采集到用户语音,并在采集到所述用户语音时,从所述回复音频中确定出针对所述用户语音的目标回复音频,以及在输出所述目标回复音频的同时,将所述目标回复音频对应的虚拟动画在所述页面图像中叠加显示。
作为一种可选的实施方式,在本申请实施例第一方面中,所述方法还包括:
在采集到用户语音时,依据所述学习内容得到所述用户语音对应的标准音频;
判断所述用户语音与所述标准音频的匹配度是否大于预设匹配度;
若大于所述预设匹配度,执行所述的从所述回复音频中确定出针对所述用户语音的目标回复音频;
若小于或者等于所述预设匹配度,输出所述标准音频。
本申请实施例第二方面公开一种包含可翻转摄像装置的智能音箱,包括:
拍摄单元,用于控制翻转至第一预设位置的所述摄像装置拍摄与所述智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于所述第一预设位置的所述摄像装置的摄像孔朝向所述放置面;
识别单元,用于识别所述页面图像中的学习内容所属的学习项目;
显示单元,用于在所述智能音箱的显示屏幕上显示所述页面图像,并且在所述页面图像上叠加显示与所述学习项目对应的增强现实对象。
作为一种可选的实施方式,在本申请实施例第二方面中,
若所述学习项目为阅读练习,所述显示单元用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,用于依据所述学习内容构建虚拟场景;以及,控制所述摄像装置翻转至第二预设位置;其中,处于所述第二预设位置的所述摄像装置的摄像孔朝向所述显示屏幕的前方;以及,控制所述摄像装置拍摄人脸图像,并依据所述人脸图像生成第一虚拟卡通人物;以及,将所述第一虚拟卡通人物添加至所述虚拟场景,并将添加所述第一虚拟卡通人物的所述虚拟场景在所述页面图像中叠加显示。
作为一种可选的实施方式,在本申请实施例第二方面中,若所述学习项目为立体几何练习,所述显示单元用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,用于识别所述学习内容中的印刷几何体和手写辅助线;以及,生成所述印刷几何体的三维虚拟模型,并依据所述手写辅助线和所述印刷几何体的位置关系,在所述三维虚拟模型中添加所述手写辅助线对应的三维虚拟线段,得到目标虚拟模型;以及,在所述页面图像中叠加显示所述目标虚拟模型。
作为一种可选的实施方式,在本申请实施例第二方面中,
若所述学习项目为口语练习,所述显示单元用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,用于获取与用户对话的第二虚拟卡通人物;以及,依据所述学习内容确定所述第二虚拟卡通人物的回复音频,并综合所述第二虚拟卡通人物和每一所述回复音频,得到每一所述回复音频对应的虚拟动画;以及,检测是否采集到用户语音,并在采集到所述用户语音时,从所述回复音频中确定出针对所述用户语音的目标回复音频,以及在输出所述目标回复音频的同时,将所述目标回复音频对应的虚拟动画在所述页面图像中叠加显示。
作为一种可选的实施方式,在本申请实施例第二方面中,所述智能音箱还包括:
获取单元,用于所述显示单元采集到所述用户语音时,依据所述学习内容得到所述用户语音对应的标准音频;
判断单元,用于判断所述用户语音与所述标准音频的匹配度是否大于预设匹配度;以及,在大于所述预设匹配度时,触发所述显示单元执行所述的从所述回复音频中确定出针对所述用户语音的目标回复音频;以及,在小于或者等于所述预设匹配度时,输出所述标准音频。
本申请实施例第三方面公开一种智能音箱,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本申请实施例第一方面公开的任一项方法。
本申请第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本申请实施例第一方面公开的任一项方法。
本申请实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请实施例第一方面公开的任一项方法。
与现有技术相比,本申请实施例具有以下有益效果:
在本申请实施例中,当安装于智能音箱上到的可翻转摄像装置翻转至第一预设位置时,利用该摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;识别页面图像中的学习内容所属的学习项目;在智能音箱的显示屏幕上显示页面图像,并且在页面图像上叠加显示与学习项目对应的增强现实对象。通过实施该方法,在页面图像上叠加显示与学习项目对应的增强现实对象,可以起到吸引用户注意力的目的,增强了学习的趣味性,有利于提高学习效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种学习互动方法的流程示意图;
图2是本申请实施例公开的另一种学习互动方法的流程示意图;
图3是本申请实施例公开的一种智能音箱的结构示意图;
图4是本申请实施例公开的另一种智能音箱的结构示意图;
图5是本申请实施例公开的另一种智能音箱的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例公开了一种学习互动方法及智能音箱,能够提高学习效率。
以下分别进行详细说明。
实施例一
请参阅图1,图1是本申请实施例公开的一种学习互动方法的流程示意图。如图1所示,该学习互动方法应用于包含可翻转摄像装置的智能音箱,该方法可以包括以下步骤:
101、控制翻转至第一预设位置的智能音箱的摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于第一预设位置的智能音箱的摄像装置的摄像孔朝向放置面。
作为一种可选的实施方式,在本申请实施例中,在执行步骤101之前,还可以执行以下步骤:
获取书本页面的放置面所处区域的环境亮度;
判断上述环境亮度是否小于预设亮度;
若大于或者等于预设亮度,继续执行步骤101;
若小于预设亮度,依据上述环境亮度与预设亮度的亮度差值,确定照明参数;以及,控制设置于智能音箱上的照明装置按照该照明参数的指示工作。
进一步可选的,依据上述环境亮度与预设亮度的亮度差值,确定照明参数之后,还可以执行以下步骤:
获取书本页面的放置面所处区域的三维建模图;
在三维建模图中标记上述放置面的位置坐标;
依据上述放置面的位置坐标,从上述三维建模图中确定出照明区域覆盖上述放置面的照明终端;
依据照明终端的设备标识,向照明终端发送携带有照明参数的照明请求,以使该照明终端按照该照明参数的指示工作。
实施该方法,在书本页面的放置面所处区域的环境亮度小于预设亮度时,可以利用设置于智能音箱上的照明装置或者照明区域覆盖上述放置面的照明终端进行补光,可以提高页面图像的清晰度。
102、识别页面图像中的学习内容所属的学习项目。
103、在智能音箱的显示屏幕上显示页面图像。
104、在页面图像上叠加显示与上述学习项目对应的增强现实对象。
作为一种可选的实施方式,在本申请实施例中,步骤102之后还可以执行以下步骤:
检测智能音箱的当前工作模式,该当前工作模式可以为单人模式或者多人模式;
若智能音箱的当前工作模式为单人模式,继续执行步骤103~步骤104;
若智能音箱的当前工作模式为多人模式,输出投影提示信息,并检测智能音箱是否连接大屏投影设备,以及在智能音箱连接大屏投影设备时,将页面图像和与上述学习项目对应的增强现实对象发送至大屏投影设备,以在大屏投影设备上显示叠加上述学习项目对应的增强现实对象的页面图像。
通过实施该方法,智能音箱为多人模式时,可以将叠加上述学习项目对应的增强现实对象的页面图像在大屏投影终端显示,极大提高了多用户同时操作的便利性,有利于提高用户的使用体验感。
进一步的,在页面图像上叠加显示与上述学习项目对应的增强现实对象之后,还可以执行以下步骤:
检测是否收到针对上述学习项目对应的增强现实对象的操作手势;
若收到,依据上述操作手势确定增强现实对象的预设动作;
控制上述增强现实对象执行预设动作。
需要说明的是,上述预设动作可以为缩小、放大或者翻转,用户基于操作手势与增强现实对象互动,可以提高学习的趣味性。
在本申请实施例中,上述学习项目可以为阅读练习或者立体几何练习,以下进行详细说明:
若上述学习项目为阅读练习,在页面图像上叠加显示与上述学习项目对应的增强现实对象,可以包括:
依据页面图像中的学习内容构建虚拟场景;
控制智能音箱的摄像装置翻转至第二预设位置;其中,处于第二预设位置的智能音箱的摄像装置的摄像孔朝向显示屏幕的前方;
控制智能音箱的摄像装置拍摄人脸图像,并依据该人脸图像生成第一虚拟卡通人物;
将第一虚拟卡通人物添加至上述虚拟场景,并将添加第一虚拟卡通人物的上述虚拟场景在页面图像中叠加显示。
在本申请实施例中,依据页面图像中的学习内容构建虚拟场景可以包括:
在建模素材库中查找页面图像中的学习内容的关联建模素材;
从关联建模素材中确定符合用户信息的目标建模素材;其中,用户信息至少包括用户的年龄和性别;
利用目标建模素材构建虚拟场景。
实施上述方法,在阅读练习时,可以依据用户信息确定建模素材,使得所构建的虚拟场景更加贴合用户。
若上述学习项目为立体几何练习,在页面图像上叠加显示与上述学习项目对应的增强现实对象,可以包括:
识别页面图像中的学习内容中的印刷几何体和手写辅助线;
生成印刷几何体的三维虚拟模型,并依据手写辅助线和印刷几何体的位置关系,在三维虚拟模型中添加手写辅助线对应的三维虚拟线段,得到目标虚拟模型;
在页面图像中叠加显示目标虚拟模型。
作为一种可选的实施方式,在本申请实施例中,生成印刷几何体的三维虚拟模型之后,还可以执行以下步骤:
判断手写辅助线是否正确;
若正确,执行上述的依据手写辅助线和印刷几何体的位置关系,在三维虚拟模型中添加手写辅助线对应的三维虚拟线段,得到目标虚拟模型;
若不正确,输出警示信息,并检测是否收到订正指令,以及在收到该订正指令时,依据标准辅助线和印刷几何体的位置关系,在三维虚拟模型中添加标准辅助线对应的三维虚拟线段,得到目标虚拟模型。
实施上述方法,用户在进行立体几何体练习时,还可以对手写辅助线的正确与否进行判断,并在手写辅助线错误的情况下,对错误的手写辅助线进行订正。
若上述学习项目为书写练习,在页面图像上叠加显示与上述学习项目对应的增强现实对象,可以包括:
从页面图像中的学习内容中识别出印刷字和书写字;
确定书写字中的非规范书写字;
获取非规范书写字对应的规范书写动画;
在页面图像上叠加显示非规范书写字对应的规范书写动画。
实施上述方法,以动画形式向用户展示规范的书写笔画,可以极大的吸音用户注意力,有利于提高书写练习效果。
通过实施上述方法,有利于提高学习效果,还可以提高页面图像的清晰度,还可以极大提高多用户同时操作的便利性,还可以提高学习的趣味性,还可以使得所构建的虚拟场景更加贴合用户,还可以进一步提高学习效率,还有利于提高书写练习效果。
实施例二
请参阅图2,图2是本申请实施例公开的另一种学习互动方法的流程示意图。如图2所示,该学习互动方法应用于包含可翻转摄像装置的智能音箱,该方法可以包括以下步骤:
201、控制翻转至第一预设位置的智能音箱的摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于第一预设位置的智能音箱的摄像装置的摄像孔朝向放置面。
202、识别上述页面图像中的学习内容所属的学习项目。
203、在智能音箱的显示屏幕上显示页面图像。
在本申请实施例中,关于步骤201~步骤203的详细描述,请参照实施例一中针对步骤101~步骤103的描述,本申请实施例不再赘述。
204、若上述学习项目为口语练习,获取与用户对话的第二虚拟卡通人物。
205、依据页面图像中的学习内容确定第二虚拟卡通人物的回复音频,并综合第二虚拟卡通人物和每一回复音频,得到每一回复音频对应的虚拟动画。
206、检测是否采集到用户语音,若是,执行步骤207~步骤208;若否,结束本流程。
207、依据上述学习内容得到用户语音对应的标准音频。
208、判断用户语音与标准音频的匹配度是否大于预设匹配度,若是,执行步骤209~步骤210;若否,执行步骤211;
209、从上述回复音频中确定出针对用户语音的目标回复音频。
210、在输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示。
211、输出用户语音对应的标准音频。
需要说明的是,在本申请实施例中,步骤209之后,还可以执行以下步骤:
采集智能音箱所处区域的环境图像;
依据环境图像,判断智能音箱所处区域是否为公共区域;
若智能音箱所处区域为公共区域,检测是否收到音频定向指令;
若收到音频定向指令,获取用户位置;
依据用户位置,调整智能音箱的定向扬声器的朝向以及确定定向扬声器的输出音量;
在输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示,可以包括:
在利用上述定向扬声器按照上述输出音量输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示。
实施上述方法,用户在公共区域进行口语练习时,可以通过智能音箱的定向扬声器输出目标回复音频,可以最大程度的降低因音频扩散所导致的音量损耗,有助于用户听到清楚的目标回复音频。
在本申请实施例中,执行步骤204~步骤211,用户可以通过与第二虚拟卡通人物对话的方式练习口语,若用户语音与该用户语音对应的标准音频的匹配度小于预设匹配度,还可利用输出用户语音对应的标准音频的方式对用户语音进行校正。
通过实施上述方法,有利于提高学习效果,还可以提高页面图像的清晰度,还可以极大提高多用户同时操作的便利性,还可以提高口语练习的趣味性,还有助于用户听到清楚的目标回复音频,还可以实现用户语音校正。
实施例三
请参阅图3,图3是本申请实施例公开的包含可翻转摄像装置的智能音箱的结构示意图,如图3所示的智能音箱可以包括:
拍摄单元301,用于控制翻转至第一预设位置的摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于第一预设位置的摄像装置的摄像孔朝向放置面。
作为一种可选的实施方式,在本申请实施例中,拍摄单元301,还用于获取书本页面的放置面所处区域的环境亮度;以及,判断上述环境亮度是否小于预设亮度;以及,在放置面所处区域的环境亮度大于或者等于预设亮度时,触发执行上述的控制翻转至第一预设位置的摄像装置拍摄与智能音箱处于同一放置面的书本页面,得到页面图像;以及在放置面所处区域的环境亮度小于预设亮度时,依据上述环境亮度与预设亮度的亮度差值,确定照明参数;以及,控制设置于智能音箱上的照明装置按照该照明参数的指示工作。
进一步可选的,拍摄单元301,还用于依据上述环境亮度与预设亮度的亮度差值,确定照明参数之后,获取书本页面的放置面所处区域的三维建模图;以及,在三维建模图中标记上述放置面的位置坐标;以及,依据上述放置面的位置坐标,从上述三维建模图中确定出照明区域覆盖上述放置面的照明终端;以及,依据照明终端的设备标识,向照明终端发送携带有照明参数的照明请求,以使该照明终端按照该照明参数的指示工作。
实施上述方式,在书本页面的放置面所处区域的环境亮度小于预设亮度时,可以利用设置于智能音箱上的照明装置或者照明区域覆盖上述放置面的照明终端进行补光,可以提高页面图像的清晰度。
识别单元302,用于识别页面图像中的学习内容所属的学习项目。
显示单元303,用于在智能音箱的显示屏幕上显示页面图像,并且在页面图像上叠加显示与上述学习项目对应的增强现实对象。
作为一种可选的实施方式,在本申请实施例中,识别单元302,还用于识别页面图像中的学习内容所属的学习项目之后,检测智能音箱的当前工作模式,该当前工作模式可以为单人模式或者多人模式;以及,在智能音箱的当前工作模式为单人模式时,触发显示单元303执行上述的在智能音箱的显示屏幕上显示页面图像;以及,在智能音箱的当前工作模式为多人模式时,输出投影提示信息,并检测智能音箱是否连接大屏投影设备,以及在智能音箱连接大屏投影设备时,将页面图像和与上述学习项目对应的增强现实对象发送至大屏投影设备,以在大屏投影设备上显示叠加上述学习项目对应的增强现实对象的页面图像。通过实施该方式,在智能音箱为多人模式时,可以将叠加上述学习项目对应的增强现实对象的页面图像在大屏投影终端显示,极大提高了多用户同时操作的便利性,有利于提高用户的使用体验感。
显示单元303,还用于在页面图像上叠加显示与上述学习项目对应的增强现实对象之后,检测是否收到针对上述学习项目对应的增强现实对象的操作手势;以及,在收到操作手势时,依据该操作手势确定增强现实对象的预设动作;以及,控制增强现实对象执行预设动作。需要说明的是,上述预设动作可以为缩小、放大或者翻转,用户基于操作手势与增强现实对象互动,可以提高学习的趣味性。
在申请实施例中,若上述学习项目为阅读练习,显示单元303用于在页面图像上叠加显示与上述学习项目对应的增强现实对象的方式具体可以为:
显示单元303,用于依据页面图像中的学习内容构建虚拟场景;以及,控制上述摄像装置翻转至第二预设位置;其中,处于第二预设位置的上述摄像装置的摄像孔朝向智能音箱的显示屏幕的前方;以及,控制上述摄像装置拍摄人脸图像,并依据该人脸图像生成第一虚拟卡通人物;以及,将第一虚拟卡通人物添加至上述虚拟场景,并将添加第一虚拟卡通人物的上述虚拟场景在页面图像中叠加显示。
在本申请实施例中,显示单元303用于依据页面图像中的学习内容构建虚拟场景的方式具体可以为:
显示单元303,用于在建模素材库中查找页面图像中的学习内容的关联建模素材;以及,从关联建模素材中确定符合用户信息的目标建模素材;其中,用户信息至少包括用户的年龄和性别;以及,利用目标建模素材构建虚拟场景。实施该方式,在阅读练习时,可以依据用户信息确定建模素材,使得所构建的虚拟场景更加贴合用户。
在申请实施例中,若上述学习项目为立体几何练习,显示单元303用于在页面图像上叠加显示与上述学习项目对应的增强现实对象的方式具体可以为:
显示单元303,用于识别页面图像中的学习内容中的印刷几何体和手写辅助线;以及,生成印刷几何体的三维虚拟模型,并依据手写辅助线和印刷几何体的位置关系,在三维虚拟模型中添加手写辅助线对应的三维虚拟线段,得到目标虚拟模型;以及,在页面图像中叠加显示目标虚拟模型。
作为一种可选的实施方式,在本申请实施例中,显示单元303用于生成印刷几何体的三维虚拟模型之后,判断手写辅助线是否正确;以及,在该手写辅助线正确时,触发执行上述的依据手写辅助线和印刷几何体的位置关系,在三维虚拟模型中添加手写辅助线对应的三维虚拟线段,得到目标虚拟模型;以及,在该手写辅助线错误时,输出警示信息;以及,检测是否收到订正指令;以及,在收到订正指令时,依据标准辅助线和印刷几何体的位置关系,在三维虚拟模型中添加标准辅助线对应的三维虚拟线段,得到目标虚拟模型。实施该方式,用户在进行立体几何体练习时,还可以对手写辅助线的正确与否进行判断,并在手写辅助线错误的情况下,对错误的手写辅助线进行订正,有利于进一步提高学习效率。
在本申请实施例中,若上述学习项目为书写练习,显示单元303用于在页面图像上叠加显示与上述学习项目对应的增强现实对象的方式具体可以为:
显示单元303,用于从页面图像中的学习内容中识别出印刷字和书写字;以及,确定书写字中的非规范书写字;以及,获取非规范书写字对应的规范书写动画;以及在页面图像上叠加显示非规范书写字对应的规范书写动画。实施该方式,以动画形式向用户展示规范的书写笔画,可以极大的吸音用户注意力,有利于提高书写练习效果。
通过实施上述智能音箱,有利于提高学习效果,还可以提高页面图像的清晰度,还可以极大提高多用户同时操作的便利性,还可以提高学习的趣味性,还可以使得所构建的虚拟场景更加贴合用户,还可以进一步提高学习效率,还有利于提高书写练习效果。
实施例四
请参阅图4,图4是本申请实施例公开的另一种智能音箱的结构示意图,其中,图4所示的智能音箱是由图3所示的智能音箱优化得到,在图4所示的智能音箱中,识别单元302识别出的页面图像中的学习内容所属的学习项目为口语练习,显示单元303用于在页面图像上叠加显示与学习项目对应的增强现实对象的方式具体可以为:
显示单元303,用于获取与用户对话的第二虚拟卡通人物;以及,依据上述学习内容确定第二虚拟卡通人物的回复音频,并综合第二虚拟卡通人物和每一回复音频,得到每一回复音频对应的虚拟动画;以及,检测是否采集到用户语音,并在采集到用户语音时,从回复音频中确定出针对用户语音的目标回复音频,以及在输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示。
在本申请实施例中,图4所示的智能音箱还可以包括:
获取单元304,用于显示单元303采集到用户语音时,依据上述学习内容得到用户语音对应的标准音频。
判断单元305,用于判断用户语音与标准音频的匹配度是否大于预设匹配度;以及,在大于预设匹配度时,触发显示单元303执行上述的从回复音频中确定出针对用户语音的目标回复音频;以及,在小于或者等于预设匹配度时,输出上述标准音频。
需要说明的是,在本申请实施例中,显示单元303,还用于从回复音频中确定出针对用户语音的目标回复音频之后,采集智能音箱所处区域的环境图像;以及,依据环境图像,判断智能音箱所处区域是否为公共区域;以及,在智能音箱所处区域为公共区域时,检测是否收到音频定向指令;以及,在收到音频定向指令时,获取用户位置;以及,依据用户位置,调整智能音箱的定向扬声器的朝向以及确定定向扬声器的输出音量。
基于上述描述,显示单元303用于在输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示的方式具体可以为:
显示单元303,用于在利用上述定向扬声器按照上述输出音量输出目标回复音频的同时,将目标回复音频对应的虚拟动画在页面图像中叠加显示。
实施上述方式,用户在公共区域进行口语练习时,可以通过智能音箱的定向扬声器输出目标回复音频,最大程度的降低因音频扩散所导致的音量损耗,有助于用户听到清楚的目标回复音频。
在本申请实施例中,用户可以通过与第二虚拟卡通人物对话的方式练习口语,若用户语音与该用户语音对应的标准音频的匹配度小于预设匹配度,还可利用输出用户语音对应的标准音频的方式对用户语音进行校正。
通过实施上述智能音箱,有利于提高学习效果,还可以提高页面图像的清晰度,还可以极大提高多用户同时操作的便利性,还可以提高口语练习的趣味性,还有助于用户听到清楚的目标回复音频,还可以实现用户语音校正。
实施例5
请参阅图5,图5是本申请实施例公开的另一种智能音箱的结构示意图。如图5所示,该智能音箱可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1~图2任一种学习互动方法。
需要说明的是,图5所示的智能音箱还可以包括电源、输入按键、RF电路、Wi-Fi模块、蓝牙模块、传感器等未显示的组件,本实施例不作赘述。
本申请实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图2任一种学习互动方法。
本申请实施例公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行图1~图2任一种学习互动方法。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本申请实施例公开的一种学习互动方法及智能音箱进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种学习互动方法,其特征在于,所述方法应用于包含可翻转摄像装置的智能音箱,所述方法包括:
控制翻转至第一预设位置的所述摄像装置拍摄与所述智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于所述第一预设位置的所述摄像装置的摄像孔朝向所述放置面;
识别所述页面图像中的学习内容所属的学习项目;
在所述智能音箱的显示屏幕上显示所述页面图像,并且在所述页面图像上叠加显示与所述学习项目对应的增强现实对象;
其中,若所述学习项目为阅读练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
依据所述学习内容构建虚拟场景;
控制所述摄像装置翻转至第二预设位置;其中,处于所述第二预设位置的所述摄像装置的摄像孔朝向所述显示屏幕的前方;
控制所述摄像装置拍摄人脸图像,并依据所述人脸图像生成第一虚拟卡通人物;
将所述第一虚拟卡通人物添加至所述虚拟场景,并将添加所述第一虚拟卡通人物的所述虚拟场景在所述页面图像中叠加显示。
2.根据权利要求1所述的方法,其特征在于,若所述学习项目为立体几何练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
识别所述学习内容中的印刷几何体和手写辅助线;
生成所述印刷几何体的三维虚拟模型,并依据所述手写辅助线和所述印刷几何体的位置关系,在所述三维虚拟模型中添加所述手写辅助线对应的三维虚拟线段,得到目标虚拟模型;
在所述页面图像中叠加显示所述目标虚拟模型。
3.根据权利要求1所述的方法,其特征在于,若所述学习项目为口语练习,所述在所述页面图像上叠加显示与所述学习项目对应的增强现实对象,包括:
获取与用户对话的第二虚拟卡通人物;
依据所述学习内容确定所述第二虚拟卡通人物的回复音频,并综合所述第二虚拟卡通人物和每一所述回复音频,得到每一所述回复音频对应的虚拟动画;
检测是否采集到用户语音,并在采集到所述用户语音时,从所述回复音频中确定出针对所述用户语音的目标回复音频,以及在输出所述目标回复音频的同时,将所述目标回复音频对应的虚拟动画在所述页面图像中叠加显示。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在采集到用户语音时,依据所述学习内容得到所述用户语音对应的标准音频;
判断所述用户语音与所述标准音频的匹配度是否大于预设匹配度;
若大于所述预设匹配度,执行所述的从所述回复音频中确定出针对所述用户语音的目标回复音频;
若小于或者等于所述预设匹配度,输出所述标准音频。
5.一种包含可翻转摄像装置的智能音箱,其特征在于,包括:
拍摄单元,用于控制翻转至第一预设位置的所述摄像装置拍摄与所述智能音箱处于同一放置面的书本页面,得到页面图像;其中,处于所述第一预设位置的所述摄像装置的摄像孔朝向所述放置面;
识别单元,用于识别所述页面图像中的学习内容所属的学习项目;
显示单元,用于在所述智能音箱的显示屏幕上显示所述页面图像,并且在所述页面图像上叠加显示与所述学习项目对应的增强现实对象;
若所述学习项目为阅读练习,所述显示单元,具体用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,具体用于依据所述学习内容构建虚拟场景;以及,控制所述摄像装置翻转至第二预设位置;其中,处于所述第二预设位置的所述摄像装置的摄像孔朝向所述显示屏幕的前方;以及,控制所述摄像装置拍摄人脸图像,并依据所述人脸图像生成第一虚拟卡通人物;以及,将所述第一虚拟卡通人物添加至所述虚拟场景,并将添加所述第一虚拟卡通人物的所述虚拟场景在所述页面图像中叠加显示。
6.根据权利要求5所述的智能音箱,其特征在于,若所述学习项目为立体几何练习,所述显示单元用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,用于识别所述学习内容中的印刷几何体和手写辅助线;以及,生成所述印刷几何体的三维虚拟模型,并依据所述手写辅助线和所述印刷几何体的位置关系,在所述三维虚拟模型中添加所述手写辅助线对应的三维虚拟线段,得到目标虚拟模型;以及,在所述页面图像中叠加显示所述目标虚拟模型。
7.根据权利要求5所述的智能音箱,其特征在于,若所述学习项目为口语练习,所述显示单元用于在所述页面图像上叠加显示与所述学习项目对应的增强现实对象的方式具体为:
所述显示单元,用于获取与用户对话的第二虚拟卡通人物;以及,依据所述学习内容确定所述第二虚拟卡通人物的回复音频,并综合所述第二虚拟卡通人物和每一所述回复音频,得到每一所述回复音频对应的虚拟动画;以及,检测是否采集到用户语音,并在采集到所述用户语音时,从所述回复音频中确定出针对所述用户语音的目标回复音频,以及在输出所述目标回复音频的同时,将所述目标回复音频对应的虚拟动画在所述页面图像中叠加显示。
8.根据权利要求7所述的智能音箱,其特征在于,还包括:
获取单元,用于所述显示单元采集到所述用户语音时,依据所述学习内容得到所述用户语音对应的标准音频;
判断单元,用于判断所述用户语音与所述标准音频的匹配度是否大于预设匹配度;以及,在大于所述预设匹配度时,触发所述显示单元执行所述的从所述回复音频中确定出针对所述用户语音的目标回复音频;以及,在小于或者等于所述预设匹配度时,输出所述标准音频。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令运行时使计算机执行权利要求1~4任一项所述学习互动方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222628.5A CN111182387B (zh) | 2019-12-03 | 2019-12-03 | 一种学习互动方法及智能音箱 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222628.5A CN111182387B (zh) | 2019-12-03 | 2019-12-03 | 一种学习互动方法及智能音箱 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111182387A CN111182387A (zh) | 2020-05-19 |
CN111182387B true CN111182387B (zh) | 2021-08-20 |
Family
ID=70653767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911222628.5A Active CN111182387B (zh) | 2019-12-03 | 2019-12-03 | 一种学习互动方法及智能音箱 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111182387B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639223B (zh) * | 2020-05-26 | 2024-04-19 | 广东小天才科技有限公司 | 一种用于口语练习的虚拟对象的音频生成方法及电子设备 |
CN112306601A (zh) * | 2020-10-27 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 一种应用交互方法、装置、电子设备及存储介质 |
CN112328088B (zh) * | 2020-11-23 | 2023-08-04 | 北京百度网讯科技有限公司 | 图像的呈现方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489948B1 (en) * | 2011-11-28 | 2016-11-08 | Amazon Technologies, Inc. | Sound source localization using multiple microphone arrays |
CN106408480A (zh) * | 2016-11-25 | 2017-02-15 | 山东孔子文化产业发展有限公司 | 基于增强现实、语音识别的国学三维交互学习系统及方法 |
CN110471530A (zh) * | 2019-08-12 | 2019-11-19 | 苏州悠优互娱文化传媒有限公司 | 一种基于儿童图书的ar互动学习方法、装置、介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104253904A (zh) * | 2014-09-04 | 2014-12-31 | 广东小天才科技有限公司 | 一种实现点读学习的方法及智能手机 |
RU2015113949A (ru) * | 2015-04-16 | 2016-11-10 | Общество с ограниченной ответственностью "Лаборатория 24" | Способ обучения и средство для его осуществления |
CN106530858A (zh) * | 2016-12-30 | 2017-03-22 | 武汉市马里欧网络有限公司 | 基于ar的儿童英语学习系统及方法 |
CN108021896B (zh) * | 2017-12-08 | 2019-05-10 | 北京百度网讯科技有限公司 | 基于增强现实的拍摄方法、装置、设备及计算机可读介质 |
CN110162164A (zh) * | 2018-09-10 | 2019-08-23 | 腾讯数码(天津)有限公司 | 一种基于增强现实的学习互动方法、装置及存储介质 |
CN208707863U (zh) * | 2018-09-27 | 2019-04-05 | 歌尔智能科技有限公司 | 一种智能音箱装置 |
CN109637286A (zh) * | 2019-01-16 | 2019-04-16 | 广东小天才科技有限公司 | 一种基于图像识别的口语训练方法及家教设备 |
-
2019
- 2019-12-03 CN CN201911222628.5A patent/CN111182387B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489948B1 (en) * | 2011-11-28 | 2016-11-08 | Amazon Technologies, Inc. | Sound source localization using multiple microphone arrays |
CN106408480A (zh) * | 2016-11-25 | 2017-02-15 | 山东孔子文化产业发展有限公司 | 基于增强现实、语音识别的国学三维交互学习系统及方法 |
CN110471530A (zh) * | 2019-08-12 | 2019-11-19 | 苏州悠优互娱文化传媒有限公司 | 一种基于儿童图书的ar互动学习方法、装置、介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111182387A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111182387B (zh) | 一种学习互动方法及智能音箱 | |
US8489993B2 (en) | Storage medium storing information processing program, information processing apparatus and information processing method | |
CN106412229B (zh) | 用于移动终端的交互、信息提供、提供联系人信息的方法、装置及移动终端 | |
CN110933330A (zh) | 视频配音方法、装置、计算机设备及计算机可读存储介质 | |
KR20130083179A (ko) | 증강 현실 제공 방법 및 이를 지원하는 단말기 | |
CN108304762B (zh) | 一种人体姿态匹配方法及其设备、存储介质、终端 | |
JP2022505998A (ja) | 拡張現実データの提示方法、装置、電子機器及び記憶媒体 | |
CN107748615B (zh) | 屏幕的控制方法、装置、存储介质及电子设备 | |
CN108877334B (zh) | 一种语音搜题方法及电子设备 | |
KR20110091126A (ko) | 도서형 증강현실에서 페이지 전환에 따른 증강현실 방법 및 시스템, 이를 구현하기 위한 증강현실 처리장치 | |
CN113342435A (zh) | 一种表情处理方法、装置、计算机设备及存储介质 | |
CN108847066A (zh) | 一种教学内容提示方法、装置、服务器和存储介质 | |
WO2022231709A1 (en) | Integrating overlaid digital content into data via processing circuitry using an audio buffer | |
CN111079501B (zh) | 一种文字识别方法及电子设备 | |
CN111079726B (zh) | 一种图像处理方法及电子设备 | |
JP2019057047A (ja) | 表示制御システム、表示制御方法及びプログラム | |
CN115565518B (zh) | 互动游戏中玩家配音的处理方法及相关装置 | |
CN111639158A (zh) | 一种学习内容的显示方法及电子设备 | |
CN110599822A (zh) | 语音板书显示方法、系统及存储介质 | |
CN109766159A (zh) | 填表位置的确定方法、计算机设备以及存储介质 | |
JP2010134681A (ja) | 講演資料作成支援システム、講演資料作成支援方法及び講演資料作成支援プログラム | |
CN111652986B (zh) | 舞台效果呈现方法、装置、电子设备及存储介质 | |
CN111212323A (zh) | 音视频合成的方法、装置、电子设备及介质 | |
US10642929B2 (en) | Information display device, information display method and information display program | |
CN109492212A (zh) | 辅助填表设备、系统、方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |