CN113240781A - 基于语音驱动及图像识别的影视动画制作方法、系统 - Google Patents

基于语音驱动及图像识别的影视动画制作方法、系统 Download PDF

Info

Publication number
CN113240781A
CN113240781A CN202110548085.7A CN202110548085A CN113240781A CN 113240781 A CN113240781 A CN 113240781A CN 202110548085 A CN202110548085 A CN 202110548085A CN 113240781 A CN113240781 A CN 113240781A
Authority
CN
China
Prior art keywords
data
dimensional model
animation
character
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110548085.7A
Other languages
English (en)
Inventor
王会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongying Youbang Jianan Co ltd
Original Assignee
Dongying Youbang Jianan Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongying Youbang Jianan Co ltd filed Critical Dongying Youbang Jianan Co ltd
Priority to CN202110548085.7A priority Critical patent/CN113240781A/zh
Publication of CN113240781A publication Critical patent/CN113240781A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/2053D [Three Dimensional] animation driven by audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于语音驱动及图像识别的影视动画制作方法、系统,涉及影视制作技术领域。本发明包括获取素材:获取素材:获取作于驱动识别素材的声音、图片、视频;提取信息:提取素材计算获取声音、面部表情、肢体动作等数据资料;导入数据:将获得的数据导入到三维软件,与需要的三维模型角色建立连接,三维模型角色根据导入的数据做出相应的表情和动作,发出相应的声音;生成动画:保存三维模型角色变化的表情和动作,以及发出的声音,生成动画片段。本发明通过声音、图片、视频作为驱动识别素材,制作者可自行拍摄录制获得,降低素材获取的难度,通过提取声音、面部表情、肢体动作作为数据资料。

Description

基于语音驱动及图像识别的影视动画制作方法、系统
技术领域
本发明属于影视制作技术领域,特别是涉及一种基于语音驱动及图像识别的影视动画制作方法、系统。
背景技术
影视动画指的是动画电影,动画制作分为二维动画与三维动画技术,最有魅力并运用最广的当属三维动画,包括我们见到的动画制作大片,电视广告片头,建筑动画等都要运用三维动画技术,影视三维动画涉及影视特效创意、前期拍摄、影视3D动画、特效后期合成、影视剧特效动画等,
现有的三维动画的动画制作工作量巨大,周期长,关于语音驱动及图像识别的影视动画制作技术的运用较低,还是停留在得出简单的表情词语这个层面,得到的效果多为静态表情。
发明内容
本发明的目的在于提供一种基于语音驱动及图像识别的影视动画制作方法、系统,解决了现有的三维动画制作工作量巨大,周期长,语音驱动及图像识别的影视动画制作技术的运用较低的技术问题。
为达上述目的,本发明是通过以下技术方案实现的:
一种基于语音驱动及图像识别的影视动画制作方法,包括以下步骤:
获取素材:获取作于驱动识别素材的声音、图片、视频;
提取信息:提取素材计算获取声音、面部表情、肢体动作等数据资料;
导入数据:将获得的数据导入到三维软件,与需要的三维模型角色建立连接,三维模型角色根据导入的数据做出相应的表情和动作,发出相应的声音;
生成动画:保存三维模型角色变化的表情和动作,以及发出的声音,生成动画片段。
可选的,获取素材具体包括,通过截取或拍摄图片、视频片段作为素材,选定视频、图片素材内的个体作为肢体素材信息提取,通过截取或录制音频作为声音素材。
可选的,提取信息具体包括,提取声音、视频素材内的声音大小、音调高低和关键声音等信息,提取图片内选定角色的面部器官分布、面部表情、肢体摆放等信息,提取视频内选定角色的面部动作和肢体动作等信息。
可选的,导入数据具体包括,将声音素材数据导入到三维软件与三维模型角色建立连接后,三维软件将素材内的声音内容通过电脑合成该角色特定的音色,三维模型角色嘴部根据声音变化做出特定的变化,当声音素材具有特定的关键声音时,如笑声、哭声等时,三维模型角色会根据捕捉的关键声音的声音大小和音调高低做出相应程度的表情变化。
可选的,导入数据具体包括,将图片素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据面部数据调整面部器官位置和变化,根据肢体摆放数据调整躯体和四肢位置。
可选的,导入数据具体包括,将视频素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据视频素材中的声音数据发出具有该角色特定音色的声音,同时根据面部动作和肢体动作数据变化面部表情和改变肢体动作。
可选的,同时导入多组素材数据时,根据需求调整使用其中相关数据资料。
可选的,限制三维模型角色面部器官变化和位移幅度,设定面部器官之间的联系,设定三维模型角色头、躯干、四肢之间的约束关系。
可选的,生成动画具体包括,根据需要角度录制三维模型角色变化生成视频片段,用于影视动画制作材料。
一种基于语音驱动及图像识别的影视动画制作系统,该系统加载有如上任一项所述方法。
本发明的实施例具有以下有益效果:
本发明的一个实施例通过声音、图片、视频作为驱动识别素材,制作者可自行拍摄录制获得,降低素材获取的难度,通过提取声音、面部表情、肢体动作作为数据资料,使数据之间关联使用,增加动画角色的自然性,也可单独使用便于制作之根据需要调整,通过导入数据与三维模型角色建立连接,使三维模型角色根据数据内容做出相应动作,发出相应声音,降低影视动画的制作周期和工作量,通过生成动画片段获得影视动画制作的材料,使语音驱动及图像识别的影视动画制作技术得到极大的应用,便于获得具有表情动作变化的动态视频。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
为了保持本发明实施例的以下说明清楚且简明,本发明省略了已知功能和已知部件的详细说明。
请参阅图1所示,在本实施例中提供了一种基于语音驱动及图像识别的影视动画制作方法,包括以下步骤:
获取素材:获取作于驱动识别素材的声音、图片、视频;
提取信息:提取素材计算获取声音、面部表情、肢体动作等数据资料;
导入数据:将获得的数据导入到三维软件,与需要的三维模型角色建立连接,三维模型角色根据导入的数据做出相应的表情和动作,发出相应的声音;
生成动画:保存三维模型角色变化的表情和动作,以及发出的声音,生成动画片段。
本实施例一个方面的应用为:通过网络查询下载或使用设备录制的方式获得需要的声音、图片、视频作为素材,对素材进行裁剪、剪辑留下需要的部分,使用系统计算提取素材内的信息整合,整合后的数据导入到三维软件内与三维模型角色建立连接,运行系统三维模型角色根据数据信息做出相应的动作与发出相应的声音,最后录制三维模型角色的动作和声音后作为影视动画制作材料使用。
通过声音、图片、视频作为驱动识别素材,制作者可自行拍摄录制获得,降低素材获取的难度,通过提取声音、面部表情、肢体动作作为数据资料,使数据之间关联使用,增加动画角色的自然性,也可单独使用便于制作之根据需要调整,通过导入数据与三维模型角色建立连接,使三维模型角色根据数据内容做出相应动作,发出相应声音,降低影视动画的制作周期和工作量,通过生成动画片段获得影视动画制作的材料,使语音驱动及图像识别的影视动画制作技术得到极大的应用,便于获得具有表情动作变化的动态视频。
如图1所示,本实施例的获取素材具体包括,通过截取或拍摄图片、视频片段作为素材,选定视频、图片素材内的个体作为肢体素材信息提取,通过截取或录制音频作为声音素材,便于素材的获得。
如图1所示,本实施例的提取信息具体包括,提取声音、视频素材内的声音大小、音调高低和关键声音等信息,提取图片内选定角色的面部器官分布、面部表情、肢体摆放等信息,提取视频内选定角色的面部动作和肢体动作等信息,当一张图片或一段视频中有多个角色时,需要框选锁定提取信息的角色。
如图1所示,本实施例的导入数据具体包括,将声音素材数据导入到三维软件与三维模型角色建立连接后,三维软件将素材内的声音内容通过电脑合成该角色特定的音色,三维模型角色嘴部根据声音变化做出特定的变化,当声音素材具有特定的关键声音时,如笑声、哭声等时,三维模型角色会根据捕捉的关键声音的声音大小和音调高低做出相应程度的表情变化,根据声音素材变换的表情,需提起定义三维模型角色表情,系统识别关键声音后调用数据库内的表情,多个表情拼接替换变化形成最终效果。
如图1所示,本实施例的导入数据具体包括,将图片素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据面部数据调整面部器官位置和变化,根据肢体摆放数据调整躯体和四肢位置,静态模型可用于商业海报、绘本、宣传册等制作。
如图1所示,本实施例的导入数据具体包括,将视频素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据视频素材中的声音数据发出具有该角色特定音色的声音,同时根据面部动作和肢体动作数据变化面部表情和改变肢体动作,截取片段数据信息保存,可作为素材数据运用在其他三维模型角色上使用。
如图1所示,本实施例的同时导入多组素材数据时,根据需求调整使用其中相关数据资料,数据分为三大类:动作、声音、表情,根据需要相互搭配使用,也可细分到具体器官和肢体以增加制作的可调性。
如图1所示,本实施例的限制三维模型角色面部器官变化和位移幅度,设定面部器官之间的联系,设定三维模型角色头、躯干、四肢之间的约束关系,降低面部走形和肢体不协调的概率。
如图1所示,本实施例的生成动画具体包括,根据需要角度录制三维模型角色变化生成视频片段,用于影视动画制作材料,根据剪辑需求变换录制角度,已到达较佳的观赏效果。
请参阅图1所示,在本实施例中提供了一种基于语音驱动及图像识别的影视动画制作系统,该系统加载有如上任一项所述方法。
通过声音、图片、视频作为驱动识别素材,制作者可自行拍摄录制获得,降低素材获取的难度,通过提取声音、面部表情、肢体动作作为数据资料,使数据之间关联使用,增加动画角色的自然性,也可单独使用便于制作之根据需要调整,通过导入数据与三维模型角色建立连接,使三维模型角色根据数据内容做出相应动作,发出相应声音,降低影视动画的制作周期和工作量,通过生成动画片段获得影视动画制作的材料,使语音驱动及图像识别的影视动画制作技术得到极大的应用,便于获得具有表情动作变化的动态视频。
上述实施例可以相互结合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
在本发明的描述中,需要理解的是,方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制;方位词“内、外”是指相对于各部件本身的轮廓的内外。

Claims (10)

1.一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,包括以下步骤:
获取素材:获取作于驱动识别素材的声音、图片、视频;
提取信息:提取素材计算获取声音、面部表情、肢体动作等数据资料;
导入数据:将获得的数据导入到三维软件,与需要的三维模型角色建立连接,三维模型角色根据导入的数据做出相应的表情和动作,发出相应的声音;
生成动画:保存三维模型角色变化的表情和动作,以及发出的声音,生成动画片段。
2.如权利要求1所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,获取素材具体包括,通过截取或拍摄图片、视频片段作为素材,选定视频、图片素材内的个体作为肢体素材信息提取,通过截取或录制音频作为声音素材。
3.如权利要求1所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,提取信息具体包括,提取声音、视频素材内的声音大小、音调高低和关键声音等信息,提取图片内选定角色的面部器官分布、面部表情、肢体摆放等信息,提取视频内选定角色的面部动作和肢体动作等信息。
4.如权利要求2所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,导入数据具体包括,将声音素材数据导入到三维软件与三维模型角色建立连接后,三维软件将素材内的声音内容通过电脑合成该角色特定的音色,三维模型角色嘴部根据声音变化做出特定的变化,当声音素材具有特定的关键声音时,如笑声、哭声等时,三维模型角色会根据捕捉的关键声音的声音大小和音调高低做出相应程度的表情变化。
5.如权利要求2所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,导入数据具体包括,将图片素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据面部数据调整面部器官位置和变化,根据肢体摆放数据调整躯体和四肢位置。
6.如权利要求2所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,导入数据具体包括,将视频素材数据导入到三维软件与三维模型角色建立连接后,三维模型角色会根据视频素材中的声音数据发出具有该角色特定音色的声音,同时根据面部动作和肢体动作数据变化面部表情和改变肢体动作。
7.如权利要求4-6任意一项所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,同时导入多组素材数据时,根据需求调整使用其中相关数据资料。
8.如权利要求4-6任意一项所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,限制三维模型角色面部器官变化和位移幅度,设定面部器官之间的联系,设定三维模型角色头、躯干、四肢之间的约束关系。
9.如权利要求1所述的一种基于语音驱动及图像识别的影视动画制作方法,其特征在于,生成动画具体包括,根据需要角度录制三维模型角色变化生成视频片段,用于影视动画制作材料。
10.一种基于语音驱动及图像识别的影视动画制作系统,其特征在于,该系统加载有如权利要求1-9任一项所述方法。
CN202110548085.7A 2021-05-20 2021-05-20 基于语音驱动及图像识别的影视动画制作方法、系统 Pending CN113240781A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110548085.7A CN113240781A (zh) 2021-05-20 2021-05-20 基于语音驱动及图像识别的影视动画制作方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110548085.7A CN113240781A (zh) 2021-05-20 2021-05-20 基于语音驱动及图像识别的影视动画制作方法、系统

Publications (1)

Publication Number Publication Date
CN113240781A true CN113240781A (zh) 2021-08-10

Family

ID=77137711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110548085.7A Pending CN113240781A (zh) 2021-05-20 2021-05-20 基于语音驱动及图像识别的影视动画制作方法、系统

Country Status (1)

Country Link
CN (1) CN113240781A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581570A (zh) * 2022-03-01 2022-06-03 浙江同花顺智能科技有限公司 一种三维脸部动作生成方法和系统
WO2024060474A1 (zh) * 2022-09-22 2024-03-28 阿里巴巴(中国)有限公司 视频生成方法、信息显示方法及计算设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110227931A1 (en) * 2009-01-19 2011-09-22 Tencent Technology (Shenzhen) Company Limited Method and apparatus for changing lip shape and obtaining lip animation in voice-driven animation
CN105957129A (zh) * 2016-04-27 2016-09-21 上海河马动画设计股份有限公司 一种基于语音驱动及图像识别的影视动画制作方法
CN106485774A (zh) * 2016-12-30 2017-03-08 当家移动绿色互联网技术集团有限公司 基于语音实时驱动人物模型的表情和姿态的方法
CN107170030A (zh) * 2017-05-31 2017-09-15 珠海金山网络游戏科技有限公司 一种虚拟主播直播方法及系统
CN108734757A (zh) * 2017-04-14 2018-11-02 北京佳士乐动漫科技有限公司 一种声音与表情捕捉实现三维人脸动画的方法
CN109801349A (zh) * 2018-12-19 2019-05-24 武汉西山艺创文化有限公司 一种声音驱动的三维动画角色实时表情生成方法和系统
CN110070594A (zh) * 2019-04-25 2019-07-30 深圳市金毛创意科技产品有限公司 一种演绎时实时渲染输出的三维动画制作方法
CN111598982A (zh) * 2020-05-18 2020-08-28 南京艺德源动漫制作有限公司 一种三维动画制作的表情动作控制方法
CN111833418A (zh) * 2020-07-14 2020-10-27 北京百度网讯科技有限公司 动画交互方法、装置、设备以及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110227931A1 (en) * 2009-01-19 2011-09-22 Tencent Technology (Shenzhen) Company Limited Method and apparatus for changing lip shape and obtaining lip animation in voice-driven animation
CN105957129A (zh) * 2016-04-27 2016-09-21 上海河马动画设计股份有限公司 一种基于语音驱动及图像识别的影视动画制作方法
CN106485774A (zh) * 2016-12-30 2017-03-08 当家移动绿色互联网技术集团有限公司 基于语音实时驱动人物模型的表情和姿态的方法
CN108734757A (zh) * 2017-04-14 2018-11-02 北京佳士乐动漫科技有限公司 一种声音与表情捕捉实现三维人脸动画的方法
CN107170030A (zh) * 2017-05-31 2017-09-15 珠海金山网络游戏科技有限公司 一种虚拟主播直播方法及系统
CN109801349A (zh) * 2018-12-19 2019-05-24 武汉西山艺创文化有限公司 一种声音驱动的三维动画角色实时表情生成方法和系统
CN110070594A (zh) * 2019-04-25 2019-07-30 深圳市金毛创意科技产品有限公司 一种演绎时实时渲染输出的三维动画制作方法
CN111598982A (zh) * 2020-05-18 2020-08-28 南京艺德源动漫制作有限公司 一种三维动画制作的表情动作控制方法
CN111833418A (zh) * 2020-07-14 2020-10-27 北京百度网讯科技有限公司 动画交互方法、装置、设备以及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581570A (zh) * 2022-03-01 2022-06-03 浙江同花顺智能科技有限公司 一种三维脸部动作生成方法和系统
CN114581570B (zh) * 2022-03-01 2024-01-26 浙江同花顺智能科技有限公司 一种三维脸部动作生成方法和系统
WO2024060474A1 (zh) * 2022-09-22 2024-03-28 阿里巴巴(中国)有限公司 视频生成方法、信息显示方法及计算设备

Similar Documents

Publication Publication Date Title
US8553037B2 (en) Do-It-Yourself photo realistic talking head creation system and method
US6919892B1 (en) Photo realistic talking head creation system and method
JP4310916B2 (ja) 映像表示装置
US7027054B1 (en) Do-it-yourself photo realistic talking head creation system and method
CN1271573C (zh) 后期同步信息流
US11969543B2 (en) Video conferencing method
US20100085363A1 (en) Photo Realistic Talking Head Creation, Content Creation, and Distribution System and Method
CN113240781A (zh) 基于语音驱动及图像识别的影视动画制作方法、系统
CN1732687A (zh) 用于远程临场通信的方法、系统和装置
JP2014519082A5 (zh)
KR20080063308A (ko) 비디오의 개인화
CN115209180B (zh) 视频生成方法以及装置
CN108986190A (zh) 一种基于三维动画中非人形角色的虚拟主播的方法和系统
WO2023011221A1 (zh) 混合变形值的输出方法及存储介质、电子装置
CN102497513A (zh) 一种面向数字电视的视频虚拟人手语系统
CN1639738A (zh) 产生漫画化的正在说话的头部的方法和系统
US20030085901A1 (en) Method and system for the automatic computerized audio visual dubbing of movies
CN115515016B (zh) 一种可实现自交互回复的虚拟直播方法、系统及存储介质
CN105957129A (zh) 一种基于语音驱动及图像识别的影视动画制作方法
CN117171392A (zh) 一种基于神经辐射场和隐属性的虚拟主播生成方法与系统
CN110505405A (zh) 基于体感技术的视频拍摄系统及方法
Lin et al. A speech driven talking head system based on a single face image
CN114363557B (zh) 一种面向语义保真的虚拟会议方法及三维虚拟会议系统
CN114741541B (zh) 基于模板化编辑的ai数字人对ppt的交互控制方法及装置
AU2009223616A1 (en) Photo realistic talking head creation, content creation, and distribution system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210810

WD01 Invention patent application deemed withdrawn after publication