CN101968894A

CN101968894A - 根据汉字自动实现音唇同步的方法

Info

Publication number: CN101968894A
Application number: CN200910055531XA
Authority: CN
Inventors: 孙涛; 娄郭梁
Original assignee: SHANGHAI ICE ENTERTAINMENT CO Ltd
Current assignee: SHANGHAI ICE ENTERTAINMENT CO Ltd
Priority date: 2009-07-28
Filing date: 2009-07-28
Publication date: 2011-02-09

Abstract

一种根据汉字自动实现音唇同步的方法，该方法至少包括以下步骤：用户输入文本的步骤，对输入的文本进行解析，将输入统一成标准的数据序列信息的步骤，根据《汉字-拼音对应表格》进行数据转换，生成标准的数据序列信息的步骤，根据《拼音-动画序列对应表格》进行数据转换，生成标准的数据序列信息，根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成标准的最终数据结构的步骤，将最终数据序列信息应用到具体的渲染引擎中。本发明能通过说话的内容，直接由汉字自动实时的实现音唇同步，实时性强，使用简单，调整方便，是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。

Description

根据汉字自动实现音唇同步的方法

技术领域

本发明涉及一种音唇同步的方法，具体涉及一种根据汉字自动实现音唇同步的方法。

背景技术

传统的口形动画是先获取到说话的内容，然后由专业的美术制作人员使用三维建模软件，如3ds max或者Maya等。

目前，一种现有技术的源虚拟角色上的口形动画生成方法，包括下列步骤：1)接收文本，将文本切分为单个字，将所述字拆分为文本的音素；2)根据音素口形对应库将音素转化为对应的口形命令，其中所述音素口形对应库设定了音素对应的起始口形和终止口形；3)根据音素时长表，缩放所述口形命令中的文本的音素对应口形，其中所述音素时长表包含口形幅度的标识；4)根据所述音素时长表，计算文本的音素对应的起始口形和终止口形分别对应的起始帧和结束帧，设置所述口形命令的执行时间，其中，所述音素时长表包括音素对应口形的时长；5)执行所述口形命令，生成所述源虚拟角色上的口形动画。

这些现有技术的缺点是：

1、这些现有技术由于在获取说话内容后制作动画，不能确保动画的实时性。

2、这些现有技术制作时间周期较长，难度较大。

3、这些现有技术成本高，精确度较低，不易于普及应用。

发明内容

本发明的目的是提供一种根据汉字自动实现音唇同步的方法，能通过简单的输入所要表达的内容，生成完美的口型动画，具有使用简单，调整方便，实时性强的特性。

本发明根据汉字自动实现音唇同步的方法的目的是通过以下技术方案实现的：一种根据汉字自动实现音唇同步的方法，应用于由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中；该方法至少包括以下步骤：

步骤1，用户输入文本。

步骤2，解析处理模块对输入的文本进行解析，将输入统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功：

步骤2.1，解析处理模块对输入的文本进行解析，解析成功，则继续执行步骤3；

步骤2.2，解析失败，则返回执行步骤1。

步骤3，汉字转成拼音模块根据《汉字-拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功：

步骤3.1，汉字转成拼音模块根据《汉字-拼音对应表格》进行数据转换，转换成功，则继续执行步骤4；

步骤3.1，转换失败，则返回执行步骤1。

步骤4，拼音转成动画序列信息模块根据《拼音-动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功：

步骤4.1，拼音转成动画序列信息模块根据《拼音-动画序列对应表格》进行数据转换，转换成功，则继续执行步骤5；

步骤4.2，转换失败，则返回执行步骤1。

步骤5，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成统一格式的单个动画序列信息及动画播放时间，单个动画序列信息及动画播放时间，和下一个单个动画序列信息的融合时间的最终数据序列信息；判断最终数据序列信息转换是否成功；

步骤5.1，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，转换成功，则继续执行步骤6；

步骤5.2，转换失败，则返回执行步骤1。

步骤6，动画应用模块将最终数据序列信息应用到渲染引擎中。

上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤1中用户直接输入的文本是汉字或使用工具编辑的音乐电视字幕。

上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤4中还包括：所述的统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。

上述的根据汉字自动实现音唇同步的方法，其中，所述的步骤5中还包括：所述的融合时间是汉字与汉字之间的间隔停顿时间。

本发明根据汉字自动实现音唇同步的方法由于采用了上述方案，使之与现有技术相比，具有以下的优点和积极效果：

1、本发明根据汉字自动实现音唇同步的方法能够通过说话的内容，直接由汉字自动实时的实现音唇同步。

2、本发明根据汉字自动实现音唇同步的方法实时性强，使用简单，调整方便。

3、本发明根据汉字自动实现音唇同步的方法是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。

附图说明

图1是本发明根据汉字自动实现音唇同步的方法的流程图。

图2是本发明根据汉字自动实现音唇同步的方法的一个实施例。

具体实施方式

请参见附图1所示，本发明根据汉字自动实现音唇同步的方法应用于由由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中，该方法的具体步骤如下：

步骤1，用户直接输入文本，直接输入的文本可以是汉字或使用工具编辑的音乐电视(MTV)字幕。

步骤2，解析处理模块对输入的文本进行解析，将输入归一化为统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功；解析成功，继续执行步骤3；解析失败，则返回执行步骤1；因为中文是单字节发音的语言，输入文本的格式分为匀速发音及变速发音，普通说话时匀速发音，唱歌等是变速发音。

步骤3，汉字转成拼音模块根据《汉字-拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功；转换成功，继续执行步骤4；转换失败，则返回执行步骤1。

步骤4，拼音转成动画序列信息模块根据《拼音-动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功；转换成功，继续执行步骤5；转换失败，则返回执行步骤1；统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。

步骤5，动画序列信息解析模块根据动画序列中的信息及整个汉字的发音时间长短进行数据转换，生成统一格式的单个动画序列信息及动画播放时间，单个动画序列信息及动画播放时间，和下一个单个动画序列信息的融合时间的最终数据序列信息；判断最终数据序列信息转换是否成功；转换成功，继续执行步骤6；转换失败，则返回执行步骤1；根据上一模块的结果，计算出单个动画播放时间的长短，在汉字与汉字之间加入融合时间blend_time。

本发明根据汉字自动实现音唇同步的方法包括《汉字-拼音对应表格》：

{

啊a

阿a e

埃ai

挨ai

哎ai

唉ai

哀ai

……

}

及《拼音-动画序列对应表格》：

{

a lips_a[0.1]lips_a[0.9]

ai lips_a[0.1]lips_i[0.9]

an lips_a[0.1]lips_n[0.9]

ang lips_a[0.1]lips_ng[0.9]

ao lips_a[0.1]lips_o[0.9]

……

}

根据上述表格，请参见附图2所示，本发明根据汉字自动实现音唇同步的方法根据《汉字-拼音对应表格》将输入的文本内容“冰冻娱乐”转换成拼音及播放时间：

{

“bing，0.3”

“dong，0.3”

“yu，0.3”

“le，0.3”}

进而根据《拼音-动画序列对应表格》转化为口形动画：

{

“0.3(lips_b，0.1)，(lips_ing，0.9)”

“0.3(lips_d，0.1)，(lips_ong，0.9)”

“0.3(lips_y，0.1)，(lips_u，0.9)”

“0.3(lips_l，0.1)，(lips_e，0.9)”

}

再在汉字与汉字之间加上融合时间，输出：

{

“0.3(lips_b，0.1)，(lips_ing，0.9)blend_time”

“0.3(lips_d，0.1)，(lips_ong，0.9)blend_time”

“0.3(lips_y，0.1)，(lips_u，0.9)blend_time”

“0.3(lips_l，0.1)，(lips_e，0.9)blend_time”

}

最后在渲染引擎中渲染出三维效果。

综上所述，本发明根据汉字自动实现音唇同步的方法能够通过说话的内容，直接由汉字自动实时的实现音唇同步；本发明根据汉字自动实现音唇同步的方法实时性强，使用简单，调整方便；本发明根据汉字自动实现音唇同步的方法是目前市场上唯一一款能够通过汉字自动生成音唇同步的软件。

Claims

1.一种根据汉字自动实现音唇同步的方法，应用于由输入模块、解析处理模块、汉字转成拼音模块、拼音转成动画序列信息模块、动画序列信息解析模块及动画应用模块组成的系统中；其特征在于：该方法至少包括以下步骤：

步骤1，用户输入文本；

步骤2，解析处理模块对输入的文本进行解析，将输入统一格式的单个汉字及汉字发音时间长短的数据序列信息；判断文本解析是否成功；

步骤3，汉字转成拼音模块根据《汉字-拼音对应表格》进行数据转换，生成统一格式的汉字拼音及汉字发音时间长短的数据序列信息；判断汉字转成拼音是否成功；

步骤4，拼音转成动画序列信息模块根据《拼音-动画序列对应表格》进行数据转换，生成统一格式的动画序列信息及汉字发音时间长短的数据序列信息；判断拼音转成动画序列结构是否成功；

2.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤1中用户直接输入的文本是汉字或使用工具编辑的音乐电视字幕。

3.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤4中还包括：所述的统一格式的动画序列信息及汉字发音时间长短的数据序列信息是每个音节的动画唇形及其相对应的播放时间。

4.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤5中还包括：所述的融合时间是汉字与汉字之间的间隔停顿时间。

5.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤2中还包括：

步骤2.2，解析失败，则返回执行步骤1。

6.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤3中还包括：

步骤3.1，转换失败，则返回执行步骤1。

7.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤4中还包括：

步骤4.2，转换失败，则返回执行步骤1。

8.根据权利要求1所述的根据汉字自动实现音唇同步的方法，其特征在于：所述的步骤5中还包括：

步骤5.2，转换失败，则返回执行步骤1。