CN108847246A

CN108847246A - 一种动画制作方法、装置、终端及可读介质

Info

Publication number: CN108847246A
Application number: CN201810620421.2A
Authority: CN
Inventors: 王文斌
Original assignee: Shanghai Yude Technology Co Ltd
Current assignee: Kunshan Pinyuan Intellectual Property Operating Technology Co., Ltd.
Priority date: 2018-06-15
Filing date: 2018-06-15
Publication date: 2018-11-20

Abstract

本发明实施例公开了一种动画制作方法、装置、终端及可读介质，其中该方法包括：采集环境声音，识别所述环境声音中的孩童语音；根据所述孩童语音匹配素材数据以及动作数据；根据所述素材数据以及动作数据生成动画。本发明实施例提供的一种动画制作方法、装置、终端及可读介质，实现了对孩童表达的想法的记录，有助于家长了解孩童的心理情况。

Description

一种动画制作方法、装置、终端及可读介质

技术领域

本发明实施例涉及智能终端技术，尤其涉及一种动画制作方法、装置、终端及可读介质。

背景技术

现如今，学龄前儿童教育已受到越来越多的关注。处于3-6周岁的孩童，想象力丰富，心智开始启蒙，但因为其不具备书写能力，导致孩子的日常想法得不到记录。此外，家长多是对孩童成长过程中进行图像或视频的记录，而不会留意其日常生活中表达出来的天马行空的想法。从而，当孩子出现心理问题时得不到及时发现，并且孩子神奇的内心世界得不到记录。

发明内容

有鉴于此，本发明实施例提供了一种动画制作方法、装置、终端及可读介质，实现了对孩童表达的想法的记录，有助于家长了解孩童的心理情况。

第一方面，本发明实施例提供了一种动画制作方法，包括：

采集环境声音，识别所述环境声音中的孩童语音；

根据所述孩童语音匹配素材数据以及动作数据；

根据所述素材数据以及动作数据生成动画。

可选的，所述识别所述环境声音中的孩童语音，包括：

将所述环境声音与预先录制的孩童声纹信息进行匹配；

若匹配成功，则将所述环境声音识别为孩童语音。

可选的，所述根据所述孩童语音匹配素材数据以及动作数据，包括：

将所述孩童语音进行语义逻辑分析；

将所述分析结果与动画信息库中数据进行匹配，获取相匹配的素材数据以及动作数据。

可选的，所述根据所述素材数据以及动作数据生成动画，包括：

将所述素材数据嵌入所述动作数据对应的数据帧中；

根据所述动作数据对应的脚本代码运行所述数据帧，生成动画。

第二方面，本发明实施例提供了一种动画制作装置，包括：

语音识别模块，用于采集环境声音，识别所述环境声音中的孩童语音；

数据匹配模块，用于根据所述孩童语音匹配素材数据以及动作数据；

动画生成模块，用于根据所述素材数据以及动作数据生成动画。

可选的，所述语音识别模块，具体用于：

将所述环境声音与预先录制的孩童声纹信息进行匹配；

若匹配成功，则将所述环境声音识别为孩童语音。

可选的，所述数据匹配模块，具体用于：

将所述孩童语音进行语义逻辑分析；

可选的，所述动画生成模块，具体用于：

将所述素材数据嵌入所述动作数据对应的数据帧中；

第三方面，本发明实施例提供了一种终端，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任一实施例所述的动画制作方法。

第四方面，本发明实施例提供了一种可读介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任一实施例所述的动画制作方法。

本发明实施例提供的一种动画制作方法、装置、终端及可读介质，从采集的环境声音中识别孩童语音；根据孩童语音匹配素材数据以及动作数据；根据所述素材数据以及动作数据生成动画。根据孩童语音生成相应的动画，实现了对孩童表达的想法的记录，有助于家长了解孩童的心理情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种动画制作方法流程图；

图2是本发明实施例二提供的一种动画制作装置结构示意图；

图3是本发明实施例三提供的一种终端的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下将参照本发明实施例中的附图，通过实施方式清楚、完整地描述本发明的技术方案，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1是本发明实施例一提供的一种动画制作方法流程图，本实施例可适用于动画制作的情况，该方法可以由终端实现，具体可通过终端中的软件和/或硬件来实施。参见图1，该动画制作方法包括如下步骤：

S110、采集环境声音，识别环境声音中的孩童语音。

其中，终端可以于接收到采集指令时，采集环境声音。其中，采集指令可以通过按压终端物理按键或点击终端触摸屏上的虚拟按键生成的；采集指令也可以是通过对与终端连接的控制终端进行操作生成的，例如可以是通过对与终端连接的遥控器进行操作生成的，也可以是在手机、平板、电脑或手环等智能终端中安装终端控制应用，并在控制应用中进行点击等操作生成的。

其中，在采集环境声音后，可以对环境声音进行预处理，并根据预处理后的环境声音识别孩童语音。其中，对环境声音进行预处理操作可以包括，从环境声音中提取并分离白噪声。其中，白噪声可以理解为在整个环境声音对应的音频数据中均匀分布的随机噪声。将白噪声从环境声音中提取并分离出来，可以更清晰地对剩余声音进行识别，从而提高环境声音的识别率。

此外，对环境声音进行预处理操作还可以包括，对滤除白噪声后的环境声音进行降噪处理和语音增强处理。其中，降噪处理可以通过降噪算法完成，降噪算法例如可以是自相关算法、自适应噪声滤波法、短时谱幅度估计法、谱相减算法、小波变换等。其中，降噪处理可以理解为，将有语音时测得的噪声频谱减去没有语音时测得的噪声频谱，从而可以将环境声音中去除噪声频谱分量。其中，语音增强处理可以通过语音增强算法完成，语音增强算法包括基于谱相减的语音增强算法、基于小波分析的语音增强算法、基于卡尔曼滤波的语音增强算法、基于信号子空间的增强方法、基于听觉掩蔽效应的语音增强方法、基于独立分量分析的语音增强方法和基于神经网络的语音增强方法等。通过语音增强处理，可以进一步地改进环境声音质量，提高环境声音的语音可懂度。

其中，可以对环境声音进行分段，根据各段环境声音进行孩童声音的识别操作。具体可以是，通过梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient，MFCC)方法将环境声音进行分段处理，将每段可以定义为一帧；按环境声音的采集顺序，依次识别每帧中是否包含孩童语音信息。通过对每帧环境声音进行细化识别，提高了孩童语音识别的准确率。

可选的，所述识别环境声音中的孩童语音，包括：

将环境声音与预先录制的孩童声纹信息进行匹配；若匹配成功，则将环境声音识别为孩童语音。

其中，可以预先录制孩童的输入语音，并通过输入语音确定孩童的声纹信息，例如可以是音频和音色等信息。通过判断环境声音是否与孩童声纹信息相匹配的声音数据，可以确定环境声音中是否包含孩童声音。若存在与孩童声纹信息相匹配的声音数据，则识别该环境声音包含孩童声音，则根据该环境声音进行后续分析；若不存在与孩童声纹信息相匹配的声音数据，则识别该环境声音不包含孩童声音，则可以对该环境声音进行删除。

S120、根据孩童语音匹配素材数据以及动作数据。

其中，可以通过音节里的发音动作将孩童语音进行组合，形成多音节语音，并根据本地或网络存储的标准语音库，查找该多音节语音对应的词汇，从而可以完成对孩童语音的语义分析。其中，可以根据语孩童语音对应的语义从动画信息库中查找对应的素材数据以及动作数据。其中，素材数据可以包括人物数据(人、动物、植物和物品数据等)，背景数据(建筑物和自然环境等数据)和渲染数据(颜色渲染和环境渲染数据等)。其中，动作数据中每个动作数据可以由多帧静止数据构成，其中动作数据中每个动作数据还对应一段可编程脚本程序，当脚本程序运行时，可以依次展示多帧静止数据，用以实现动作数据的动态展示。

可选的，根据孩童语音匹配素材数据以及动作数据，包括：

将孩童语音进行语义逻辑分析；将分析结果与动画信息库中数据进行匹配，获取相匹配的素材数据以及动作数据。

其中，孩童语音进行语义逻辑分析过程中，因孩童表达逻辑与标准表达逻辑存在差异，并且孩童发音与标准发音也不相同。因此，基于标准语音库以及标准表达逻辑常常不能准确识别孩童表达语义。

基于此，在基于标准语音库进行语义分析后，可以以文本形式进行展示，当接收到校对指令时，可以根据校对指令对应的孩童语音以及校对词汇对语义分析结果进行校对。其中，可以根据校对指令对应的孩童语音以及校对词汇生成私人语音库，该私人语音库中可以存储有孩童发音对应的词汇，从而实现了特异性语音识别。其中，还可以将孩童表达逻辑与标准表达逻辑进行比对，并可以将孩童表达逻辑存储于私人数据库中。例如，正常表达逻辑为“主语+谓语+宾语”，若孩童特异性表达逻辑为“宾语+主语”，则将该孩童的表达逻辑存储于私人数据库，用于下次进行孩童语义识别。

可选的，将孩童语音进行语义逻辑分析，具体可以是，首先根据孩童私人数据库中特异性表达逻辑对孩童语音进行表达逻辑调整；再根据私人语音库进行语音识别；当存在私人语音库中不匹配孩童语音时，根据标准语音库识别不匹配的孩童语音。通过私人数据库以及私人语音库的设置，可以存储每个孩童对应的表达逻辑以及语音库，从而可以对孩童语音进行特异性识别，提高了孩童语音识别的准确率。

其中，动画信息库可以为本地存储的动画信息库，还可以为服务器中存储的动画信息库。其中，当本地存储的动画信息库中不存在与孩童语音语义逻辑分析结果相匹配的素材数据以及动作数据时，可以通过联网从服务器中存储的动画信息库中查找相匹配的素材数据以及动作数据。

S130、根据素材数据以及动作数据生成动画。

其中，动画生成的具体步骤，可以是将素材数据嵌入预先定义的动作数据对应的多帧静止数据中，在每帧中进行数据合成，从而生成合成图像。当运行动作数据对应的脚本程序时，可以依次展示合成图像，用以生成动画。

可选的，根据素材数据以及动作数据生成动画，包括：

将素材数据嵌入动作数据对应的数据帧中；根据动作数据对应的脚本代码运行数据帧，生成动画。

其中，素材数据嵌入动作数据对应的数据帧具体可以是，素材数据经过旋转、转动、扩大/缩小、透明度变化等处理后嵌入动作数据对应的数据帧中，从而可以提升视觉效果。其中，生成动画的格式可以是动态图象专家组(Moving Pictures Experts Group，MPEG)、VP8或VP9等。其中，还可以从动画信息库中调取动作数据对应的声音数据，并将动作数据对应的声音数据合成到动画中，从而可以提升观看体验。

其中，帧率可以理解为单位时间展示的数据帧的数量。其中，合成动画的帧率可以为初始设定值，也可以根据用户生成需求进行调整，动画的帧率越小，动画合成速度越快；动画的帧率越大，动画合成速度越慢。

其中，还可以将两个场景的动画进行合成，生成同一个动画。并且在场景切换时，可以应用预设的切换效果，例如也可以是滑动运动前段场景并切换到后段场景或以翻书页的方式切换到后段场景等。

其中，在生产成动画后，可将各动画生成动画集，用以按时间顺序记录孩童表达的想法。其中，在生成动画后，还可以使用投影或显示屏对其进行播放，从而使家长了解孩童的心理情况。

本实施例提供的动画制作方法，从采集的环境声音中识别孩童语音；根据孩童语音匹配素材数据以及动作数据；根据素材数据以及动作数据生成动画。根据孩童语音生成相应的动画，实现了对孩童表达的想法的记录，有助于家长了解孩童的心理情况。

实施例二

图2是本发明实施例二提供的一种动画制作装置结构示意图，本实施例可适用于动画制作。

参见图2，本实施例中动画制作装置，包括：

语音识别模块210，用于采集环境声音，识别环境声音中的孩童语音；

数据匹配模块220，用于根据孩童语音匹配素材数据以及动作数据；

动画生成模块230，用于根据素材数据以及动作数据生成动画。

可选的，语音识别模块210，具体用于：

可选的，数据匹配模块220，具体用于：

可选的，动画生成模块230，具体用于：

本实施例提供的动画制作装置，与实施例一提出的动画制作方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见实施例一，并且本实施例与实施例一具有相同的有益效果。

实施例三

本实施例提供了一种终端，可以用于动画制作。图3是本发明实施例三提供的一种终端的结构示意图。参见图3，该终端包括：

一个或多个处理器310；

存储器320，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器310执行，使得所述一个或多个处理器310实现如实施例一提出的动画制作方法。

图3中以一个处理器310为例；处理器310和存储器320可以通过总线或其他方式连接，图3中以通过总线连接为例。

存储器320作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的动画制作方法对应的程序指令/模块。处理器310通过运行存储在存储器320中的软件程序、指令以及模块，从而执行终端的各种功能应用以及数据处理，即实现上述的动画制作方法。

存储器320可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器320可进一步包括相对于处理器310远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本实施例提出的终端与实施例一提出的动画制作方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见实施例一，并且本实施例与实施例一具有相同的有益效果。

实施例四

本实施例提供一种可读介质，其上存储有计算机程序，该程序被处理器执行时实现如实施例一提出的动画制作方法。

本实施例提出的可读介质与实施例一提出的动画制作方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见实施例一，并且本实施例与实施例一具有相同的有益效果。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种动画制作方法，其特征在于，包括：

采集环境声音，识别所述环境声音中的孩童语音；

根据所述孩童语音匹配素材数据以及动作数据；

根据所述素材数据以及动作数据生成动画。

2.根据权利要求1所述的方法，其特征在于，所述识别所述环境声音中的孩童语音，包括：

将所述环境声音与预先录制的孩童声纹信息进行匹配；

若匹配成功，则将所述环境声音识别为孩童语音。

3.根据权利要求1所述的方法，其特征在于，所述根据所述孩童语音匹配素材数据以及动作数据，包括：

将所述孩童语音进行语义逻辑分析；

4.根据权利要求1所述的方法，其特征在于，所述根据所述素材数据以及动作数据生成动画，包括：

将所述素材数据嵌入所述动作数据对应的数据帧中；

5.一种动画制作装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述语音识别模块，具体用于：

将所述环境声音与预先录制的孩童声纹信息进行匹配；

若匹配成功，则将所述环境声音识别为孩童语音。

7.根据权利要求5所述的装置，其特征在于，所述数据匹配模块，具体用于：

将所述孩童语音进行语义逻辑分析；

8.根据权利要求5所述的装置，其特征在于，所述动画生成模块，具体用于：

将所述素材数据嵌入所述动作数据对应的数据帧中；

9.一种终端，其特征在于，所述终端包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-4中任一所述的动画制作方法。

10.一种可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-4中任一所述的动画制作方法。