CN104574474A

CN104574474A - 一种通过字幕生成动画角色语言口型的匹配方法

Info

Publication number: CN104574474A
Application number: CN201510009506.3A
Authority: CN
Inventors: 何玉欣
Original assignee: Individual
Current assignee: Individual
Priority date: 2015-01-09
Filing date: 2015-01-09
Publication date: 2015-04-29

Abstract

本发明提供一种通过字幕生成的动画角色语言口型的匹配方法，所要解决的问题是：在制作有大量发声的动画时，动画角色的口型动画量很大，在制作过程中费时费力，浪费了大量的人力物力资源；本发明的技术要点是：利用正则表达式或SDK解析字幕文件，把字幕中的文字转化为发音编码；在预设的7种发音口型组合中选取每一个单字所用到的口型，并根据已经统计完毕的发音编码的发音时间和发音顺序在时间轨上融合挑选出的发音口型。本发明的有益效果是：本发明只依赖于字幕文件，无需对音频中的人声进行解析，对系统资源消耗较少，对硬件配置要求低，可实现实时显示口型。

Description

一种通过字幕生成动画角色语言口型的匹配方法

技术领域

本发明涉及动画口型匹配技术领域，尤其是一种通过字幕生成的动画角色语言口型的匹配方法。

背景技术

一个完整发声动画包括动画部分和发声部分，发声部分一般存在相应的字幕文件，该字幕文件中含有发声文字以及与发声文字相对应的匹配时间轨。在制作有大量发声的动画时，动画角色的口型动画量很大，在制作过程中费时费力，浪费了大量的人力物力资源。

为了完成口型动画与发声的准确匹配，其外界环境要求极为苛刻，如：授权公告号：CN 101826216 B需要借助解析音频达到匹配口型的目的，动画的音频文件中时常存在较多所需人声以外的杂音，此时就无法达到令人满意的精确度，所以通常需要一个相对安静的环境进行匹配，并且对音频进行解析需要消耗较多的系统资源，不适合在现有移动终端上使用；而授权公告号：CN 101520903 B需要手动指定口型出现的时间，自动化程度不足，尤其是人工操作中容易因为大量的重复性劳动，使操作者精神麻木，而出现人为的误差。

因此对口型要求较为精确的动画中，一种既能满足精确度，又能达到电脑自动识别的方法是极为必要的。

发明内容

本发明的目的是提供一种通过字幕生成的动画角色语言口型的匹配方法。

本发明的技术方案是：利用正则表达式或SDK解析字幕文件，把字幕中的文字转化为发音编码；在预设的7种发音口型组合中选取每一个单字所用到的口型，并根据已经统计完毕的发音编码的发音时间和发音顺序在时间轨上融合挑选出的发音口型。

所述7种发音口型组合分别为：A，I，U，E，O，D，X；

其中汉语发音与口型对应关系如下：

声母b，p，m用X口型表示；

声母f，d，t，n，l，g，k，h用D口型表示；

声母j，q，x，zh，ch，sh，r，z，c，s用I口型表示；

韵母对应关系表如下：

	i:I	u:U	ü:U
				a:A	ia:A	ua:UA
o:O		uo:UO
				e:D	ie:E		üe:UD
ai:E		uai:UE
				ei:E		uei:UE
ao:AO	iao:AO
				ou:OU	iou:OU
an:E	ian:E	uan:UE	üan:UE
				en:D	in:I	uen:UD	ün:UD
ang:A	iang:A	uang:UA
				eng:D	ing:I	ueng:UD
ong:U	iong:U

声母为y的拼音按照公知规则转换为相应韵母，如果转换后位于i列，则在前面添加I口型；

声母为w的拼音按照公知规则转换为相应韵母；

u，ü列前出现非X口型的声母，则忽略该声母；

iu用U口型表示，ui和un用D口型表示；

罗马音发声与口型对应关系如下：

元音a，i，u，e，o分别用A，I，U，E，O口型表示；

辅音m，b，p用X口型表示；

辅音k，t，n，h，r，g，d用D口型表示；

辅音s，z，y用I口型表示；

辅音w用U口型表示；

拗音忽略中间的I口型，n不做口型匹配；

英语音标与口型对应关系如下：

元音[i]，[ə]，[ɒ]，[u]，[Λ]及其对应长音分别用I，D，O，U，A口型表示；

元音[e]，[æ]用E口型表示；

双元音对应关系：[ai]：E，[ei]：E，[ɔi]：O，[au]：O，[əu]：O，[iə]：ID，[eə]：ED，[uə]：UD；

辅音[b]，[p]，[m]用X口型表示；

辅音[t]，[k]，[f]，[d]，[g]，[v]，[h]，[n]，[ŋ]，[l]，[j]用D口型表示；

辅音[ϑ]，[s]，[ts]，[∫]，[t∫]，[ð]，[z]，[dz]，[ʒ]，[dʒ]用I口型表示；

辅音[w]，[r]，[tr]，[dr]用U口型表示。

所述在时间轨上融合挑选出的发音口型步骤包括：通过简化后的预设发音符号，调用对应的预设发音口型作为关键帧，使用字幕文件中存在对每个文字的时间标记，按照该时间标记设定发音口型的持续时间，或计算该段中每个文字的平均时间，按照平均时间设定发音口型的持续时间；

通过公式Math.sin( (time / 1000.0) * 2 * Math.PI)根据时间time输出-1到1之间的数作为计算当前过渡帧的参数，根据前后的关键帧的发音口型，自动生成过渡帧；最后根据发音口型在人物上的位置坐标，将发音口型与人物组合。

本发明的有益效果是：本发明只依赖于字幕文件，无需对音频中的人声进行解析，对系统资源消耗较少，对硬件配置要求低，可实现实时显示口型。字幕文件是一种现有的通用的文件格式，其中作为本发明音画同步关键的文字出现时间由第三方编写，并经过公众多次校验，是一种可靠的公共资源。因为字幕文件是一种通用的文件格式，所以即使仍然存在偏差，也可由用户在例如音乐播放器之类的客户端上进行调节，达到与现有技术的良好兼容。

目前对字幕文件的利用仅限于显示文字，本发明通过解析字幕文件生成口型并实现自动音画同步，是对字幕文件的一种新的利用。

附图说明

图1是本发明的流程图。

具体实施方式

实施例 1

参见图1，利用正则表达式或SDK解析字幕文件，把字幕中的文字转化为发音编码；在预设的7种发音口型组合中选取每一个单字所用到的口型，并根据已经统计完毕的发音编码的发音时间和发音顺序在时间轨上融合挑选出的发音口型。

所述7种发音口型组合分别为：A，I，U，E，O，D，X；

其中汉语发音与口型对应关系如下：

声母b，p，m用X口型表示；

声母f，d，t，n，l，g，k，h用D口型表示；

声母j，q，x，zh，ch，sh，r，z，c，s用I口型表示；

韵母对应关系表如下：

声母为w的拼音按照公知规则转换为相应韵母；

u，ü列前出现非X口型的声母，则忽略该声母；

iu用U口型表示，ui和un用D口型表示；

罗马音发声与口型对应关系如下：

元音a，i，u，e，o分别用A，I，U，E，O口型表示；

辅音m，b，p用X口型表示；

辅音k，t，n，h，r，g，d用D口型表示；

辅音s，z，y用I口型表示；

辅音w用U口型表示；

拗音忽略中间的I口型，n不做口型匹配；

英语音标与口型对应关系如下：

元音[e]，[æ]用E口型表示；

辅音[b]，[p]，[m]用X口型表示；

辅音[w]，[r]，[tr]，[dr]用U口型表示。

Claims

1.一种通过字幕生成的动画角色语言口型的匹配方法，其特征在于：利用正则表达式或SDK解析字幕文件，把字幕中的文字转化为发音编码；在预设的7种发音口型组合中选取每一个单字所用到的口型，并根据已经统计完毕的发音编码的发音时间和发音顺序在时间轨上融合挑选出的发音口型。

2.根据权利要求1所述一种通过字幕生成的动画角色语言口型的匹配方法，其特征是：所述7种发音口型组合分别为：A，I，U，E，O，D，X；

其中汉语发音与口型对应关系如下：

声母b，p，m用X口型表示；

声母f，d，t，n，l，g，k，h用D口型表示；

声母j，q，x，zh，ch，sh，r，z，c，s用I口型表示；

韵母对应关系如下表：

声母为w的拼音按照公知规则转换为相应韵母；

u，ü列前出现非X口型的声母，则忽略该声母；

iu用U口型表示，ui和un用D口型表示；

罗马音发声与口型对应关系如下：

元音a，i，u，e，o分别用A，I，U，E，O口型表示；

辅音m，b，p用X口型表示；

辅音k，t，n，h，r，g，d用D口型表示；

辅音s，z，y用I口型表示；

辅音w用U口型表示；

拗音忽略中间的I口型，n不做口型匹配；

英语音标与口型对应关系如下：

元音[e]，[æ]用E口型表示；

辅音[b]，[p]，[m]用X口型表示；

辅音[w]，[r]，[tr]，[dr]用U口型表示。

3.根据权利要求1所述一种通过字幕生成的动画角色语言口型的匹配方法，其特征是：所述在时间轨上融合挑选出的发音口型步骤包括：通过简化后的预设发音符号，调用对应的预设发音口型作为关键帧，使用字幕文件中存在对每个文字的时间标记，按照该时间标记设定发音口型的持续时间，或计算该段中每个文字的平均时间，按照平均时间设定发音口型的持续时间；