JP2008052628A - アニメーションデータ作成装置及びアニメーションデータ作成プログラム - Google Patents
アニメーションデータ作成装置及びアニメーションデータ作成プログラム Download PDFInfo
- Publication number
- JP2008052628A JP2008052628A JP2006230543A JP2006230543A JP2008052628A JP 2008052628 A JP2008052628 A JP 2008052628A JP 2006230543 A JP2006230543 A JP 2006230543A JP 2006230543 A JP2006230543 A JP 2006230543A JP 2008052628 A JP2008052628 A JP 2008052628A
- Authority
- JP
- Japan
- Prior art keywords
- visual element
- data
- phoneme
- unit
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
【解決手段】アニメーションデータ作成装置は、音声データ42から音素データ列を作成し、音素ラベルと視覚素ラベルとの対応関係を用いて音素ラベルを視覚素ラベルに変換して三つ組視覚素データ列を作成する三つ組視覚素データ列作成部80と、各三つ組視覚素データについて、視覚素コーパス62から、三つ組視覚素ラベルが一致し、継続長及び音声の平均パワーに基づいて最適と評価されるユニットを選択する三つ組視覚素ユニット選択部82と、選択されたユニットに含まれる顔の動きデータを、三つ組視覚素データの時系列にしたがって時間軸上で連結して顔のアニメーションデータを作成する三つ組視覚素ユニット連結部84とを含む。
【選択図】 図1
Description
T.ヨツクラ他、「動的特徴を用いたHMMからのリップシンクアニメーション」、ACM SIGGRAPH2006予稿集CD、2006年7月30日(T. Yotsukura et al., "Lip-sync Animation from HMM Using Dynamic Features", ACM SIGGRAPH 2006, 30 July 2006, Boston, Massachusetts)
以下、本発明の一実施の形態に係るプログラムにより実現されるリップシンクアニメーション作成装置の機能的構成について説明する。図1に、このリップシンクアニメーション作成装置40のブロック図を示す。図1を参照して、リップシンクアニメーション作成装置40は、所定のテキストを発話しているときの発話者50の顔の特徴点の動きをその音声とともに収録し、音声−視覚素コーパスを作成するための収録システム60と、収録システム60により作成された音声−視覚素コーパスを記憶するための音声−視覚素コーパス記憶部62と、入力される音声データ42から、音声データ42と同期して動く、顔の特徴点の動きベクトル列をアニメーションデータとして合成するためのアニメーションデータ合成装置44と、アニメーションデータ合成装置44により合成されたアニメーションデータを記憶するためのアニメーションデータ記憶部46とを含む。
本実施の形態に係る顔アニメーションの作成システム40は以下のように動作する。リップシンクアニメーション作成装置40の動作は大きく四つのフェーズに分けることができる。第1のフェーズは音声−視覚素コーパス記憶部62を作成するフェーズである。第2のフェーズは音声−視覚素コーパス記憶部62を用いて入力される音声データ42からアニメーションデータ記憶部46を作成するフェーズである。第3のフェーズは、顔モデルを用い、アニメーションデータ記憶部46からアニメーションを作成しアニメーション記憶部98に格納するフェーズである。最後のフェーズは、アニメーション記憶部98に記憶されたアニメーションを表示部52に表示するフェーズである。以下、各フェーズにおけるリップシンクアニメーション作成装置40の動作について説明する。
以下に、収録システム60が収録を行ない、音声−視覚素コーパス記憶部62を生成する動作について説明する。図2及び図3を参照して、発話者50の頭部110の各特徴点160には、マーカを予め装着しておく。その状態で、発話者は発話を行なう。音声・視覚素コーパスを充実したものにするために、又は、各音素がバランスよく含まれるようにするために、発話の内容を事前に決めておき、発話者50にその内容で発話を行なってもらう。この発話の内容は、図5に示す発話テキスト記憶部204に記憶される。
第2のフェーズはアニメーションデータ合成装置44による。キャラクタの声を表す音声データ42が準備され、三つ組視覚素データ列作成部80に与えられる。この音声データ42は、事前に、キャラクタの声を担当する発話者(又は声優)によって発話されたものを録音することにより得られる。音声データ42の発話テキストは図10に示す発話テキスト記憶部286に格納される。
アニメーションの作成は、図1に示すアニメーション作成装置48により行なわれる。図1を参照して、顔モデル変形部92は、顔モデル記憶部90に記憶された顔モデルを読み出す。この顔モデルについては、音声−視覚素コーパス記憶部62を作成したときの特徴点と仮想マーカとの対応付けが既に行なわれており、さらに顔モデルを構成する各ノードに対応する仮想マーカも既に定められているものとする。
アニメーションの表示はアニメーション読出部100及び表示部52により行なわれる。表示処理では、アニメーション読出部100がアニメーション記憶部98に格納された画像を先頭から順次読出し、規定の時間間隔で、表示部52内の図示されないフレームメモリに書込む。表示部52はこのフレームメモリに書き込まれた画像を所定時間間隔で読出し、画面に表示する。その結果、表示部52の画面上には、入力される音声データ42に対応して変化する、顔モデル記憶部90に記憶されたアニメーションキャラクタの顔モデルにより規定された顔のアニメーションが表示される。
本実施の形態のリップシンクアニメーション作成装置40の各機能部は、収録システム60(図1及び図2参照)の録画・録音システム112及びMoCapシステム114に含まれる一部の特殊な機器を除き、いずれもコンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。図18はこのコンピュータシステム450の外観を示し、図19はコンピュータシステム450の内部構成を示す。
なお、上記した実施の形態では、視覚素コーパス及び視覚素データの視覚素ラベルとして、三つ組視覚素ラベルを用いている。こうすることにより、ある視覚素に対応する発話の前後の発話における顔の動きまで反映した形で、適切な視覚素ユニットを選択できる。しかし本発明はそのような実施の形態には限定されない。例えば視覚素ラベルとして一つだけを使用してもよい。この場合、得られる視覚素ユニットの不連続部分が大きくなる可能性があるが、上記した加重加算処理によって滑らかに連結することができる。
44 アニメーションデータ合成装置
48 アニメーション作成装置
60 収録システム
62 音声−視覚素コーパス記憶部
80 三つ組視覚素データ列作成部
82 三つ組視覚素ユニット選択部
84 三つ組視覚素ユニット連結部
92 顔モデル変形部
96 レンダリング部
100 アニメーション読出部
112 録画・録音システム
114 MoCapシステム
116 音声・動画データ
122 データセット作成装置
138 データ処理装置
144 三つ組視覚素データ列作成部
146 正規化処理部
148 結合部
200,280 フレーム化処理部
201,282 特徴抽出部
202,284 音響モデル記憶部
204,286 発話テキスト記憶部
206,288 ビタビアライメント部
210,290 音素−視覚素変換テーブル記憶部
212,292 音素−視覚素変換部
214,293 視覚素データ列記憶部
216,294 視覚素−三つ組視覚素変換部
218,295 三つ組視覚素データ列記憶部
234,296 三つ組視覚素データ列
240 音声波形データ
242 動きベクトル列
244 三つ組視覚素ユニット列
300 三つ組視覚素データ列
Claims (7)
- 視覚素コーパスを記憶した第1の記憶手段を備えたコンピュータにおいて、入力される音声データに基づき、前記音声データに対応して動く口を含む顔のアニメーションデータを作成するためのアニメーションデータ作成プログラムであって、
前記視覚素コーパスは、音声付の発話時の顔の映像から作成した複数の視覚素ユニットを含み、
各視覚素ユニットは、視覚素ラベルと、当該視覚素ユニットに対応する顔の動きを示す動きデータと、当該視覚素ユニットに対応する音声から得られた、当該視覚素ユニットに対応する音素の継続長を含む韻律情報とを含み、
前記プログラムは、前記音声データを、音声データにより表される音素を特定する音素データ列に変換するための第1の変換手段として前記コンピュータを機能させ、
前記音素データ列は、音素ラベルと、前記音声データ中の当該音素部分の継続長を含む韻律情報とからなる音素データを含み、
前記プログラムはさらに、前記第1の変換手段の出力する前記音素データ列中の音素データに含まれる音素ラベルの各々を、対応の視覚素ラベルに変換することにより、視覚素データ列を出力するための第2の変換手段として前記コンピュータを機能させ、
前記第2の変換手段の出力する視覚素データ列は、視覚素ラベルと、前記音声データ中における、当該視覚素データに対応する部分から得られる、少なくとも当該視覚素データに対応する音素の継続長を含む韻律情報とからなる視覚素データを含み、
前記プログラムはさらに、
前記視覚素データ列に含まれる視覚素データの各々について、前記視覚素コーパス内の視覚素ユニットの内、当該視覚素データに含まれる視覚素ラベルと同じ視覚素ラベルを持ち、かつ当該視覚素データに含まれる韻律情報と、前記視覚素コーパスに含まれる各視覚素が有する韻律情報とにより音声の類似度を評価する評価関数により、当該視覚素データに含まれる音声と最も類似した音声を持つと評価された視覚素ユニットを前記視覚素コーパスから選択するための第1の選択手段と、
前記第1の選択手段により選択された視覚素ユニットに含まれる動きデータを視覚素データ列の順序にしたがい時間軸上で連結することにより、前記入力される音声データに対応する口のアニメーションデータを作成するための連結手段として前記コンピュータを機能させる、アニメーションデータ作成プログラム。 - 前記視覚素コーパスに含まれる視覚素ユニットの各々に含まれる音声の韻律情報は、当該視覚素ユニットに対応する音声の継続長に加えて当該継続期間中の音声の平均パワーを含み、
前記第1の変換手段は、前記音声データを、音素データ列に変換するための手段を含み、前記音素データ列は、音素ラベルと、前記音声データ中の当該音素部分の継続長及び平均パワーとからなる音素データを含み、
前記第1の選択手段は、
前記視覚素データ列に含まれる視覚素データの各々について、前記視覚素コーパス内の視覚素ユニットの内、当該視覚素データに含まれる視覚素ラベルと同じ視覚素ラベルを持つ視覚素ユニットの各々について、当該視覚素データに含まれる継続長及び平均パワーと、当該視覚素ユニットが有する継続長及び平均パワーとにより音声の類似度を評価する評価関数の値を評価するための評価手段と、
前記評価手段により、当該視覚素データに含まれる音声と最も類似した音声を持つと評価された視覚素ユニットを前記視覚素コーパスから選択するための第2の選択手段とを含む、請求項1に記載のアニメーションデータ作成プログラム。 - 前記コンピュータは、音素ラベルと、視覚素ラベルとの対応関係を記憶した音素−視覚素変換テーブルを記憶するための第2の記憶手段をさらに含み、
前記第2の変換手段は、前記第1の変換手段の出力する前記音素データ列の音素データに含まれる音素ラベルの各々を、前記音素−視覚素変換テーブルを参照することによって対応の視覚素ラベルに変換して、視覚素データ列を出力するための手段を含む、請求項1又は請求項2に記載のアニメーションデータ作成プログラム。 - 前記視覚素コーパスの各視覚素ユニットは、前記音声付の発話時の顔の映像から前記複数の視覚素ユニットを作成した際の、前記各視覚素に先行する第1の数の視覚素ユニットの視覚素ラベル、及び前記各視覚素に後続する第2の数の視覚素ユニットの視覚素ラベルをさらに含み、前記先行する前記第1の数の視覚素ユニットの視覚素ラベルと、前記各視覚素ユニットの視覚素ラベルと、前記後続する前記第2の数の視覚素ユニットの視覚素ラベルとは、視覚素ラベルの組を構成し、
前記第2の変換手段は、
前記第1の変換手段の出力する前記音素データ列中の音素データの各々に対し、当該音素データに含まれる音素ラベルと、その前の前記第1の数の音素データに含まれる音素ラベルと、その後の前記第2の数の音素データに含まれる音素ラベルとの各々を、対応の視覚素ラベルに変換し、音素データの順番に組合せて視覚素ラベルの組を作成するための手段と、
前記第1の変換手段の出力する前記音素データ列中の音素データの各々に対し、前記第1の変換手段の出力する前記音素データ列中の音素データに含まれる音素ラベルを、前記視覚素ラベルの組を作成するための手段により得られた視覚素ラベルの組で置換することにより、前記視覚素ラベルデータを作成し、出力するための手段とを含み、
前記第1の選択手段は、前記視覚素データ列に含まれる視覚素データの各々について、前記視覚素コーパス内にある、処理対象の視覚素データに含まれる視覚素ラベルの組と同じ視覚素ラベルの組を持ち、かつ当該処理対象の視覚素データに含まれる韻律情報と、前記視覚素コーパスに含まれる各視覚素ユニットが有する韻律情報とにより音声の類似度を評価する評価関数により、当該視覚素データに含まれる音声と最も類似した音声を持つと評価された視覚素ユニットを前記視覚素コーパスから選択するための第2の選択手段を含む、請求項1に記載のアニメーションデータ作成プログラム。 - 前記第2の選択手段は、
前記視覚素データ列に含まれる視覚素データの各々について、前記視覚素コーパス内に、当該処理対象の視覚素データに含まれる視覚素ラベルの組と同じ視覚素ラベルの組を持つ視覚素ユニットが存在するか否かを判定するための判定手段と、
前記判定手段により、前記視覚素コーパス内に、当該処理対象の視覚素データに含まれる視覚素ラベルの組と同じ視覚素ラベルの組を持つ視覚素ユニットが存在すると判定されたことに応答して、それら視覚素ユニットの各々に関し、当該視覚素データに含まれる韻律情報と、前記視覚素コーパスに含まれる各視覚素ユニットが有する韻律情報とにより音声の類似度を評価する評価関数の値を算出するための第1の算出手段と、
前記判定手段により、前記視覚素コーパス内に、当該視覚素データに含まれる視覚素ラベルの組と同じ視覚素ラベルの組を持つ視覚素ユニットが存在しないと判定されたことに応答して、処理対象の視覚素データの視覚素ラベルの組のうち、処理対象の視覚素データの視覚素ラベルを含む一部からなる部分的視覚素ラベルのみを基準として、前記視覚素コーパス内から、当該一部と位置及び内容が一致する視覚素ラベルの組を持つ視覚素ユニットを選択するための手段と、
前記選択するための手段により選択された視覚素ユニットの各々について、処理対象の視覚素データに含まれる韻律情報との間で前記評価関数の値を算出するための第2の算出手段と、
前記第1の算出手段又は前記第2の算出手段により算出された評価関数の値が最も小さな視覚素ユニットを選択するための手段とを含む、請求項4に記載のアニメーションデータ作成プログラム。 - 前記連結手段は、前記選択手段により選択された視覚素ユニットに含まれる動きデータのうち、時間軸上で連続する二つの視覚素ユニットの動きデータについて、先行する視覚素ユニットの動きデータの最後の一部分の動きデータと、後続する視覚素ユニットの先頭の一部分の動きデータとの各々を、時間に応じた重み付けをして加算することにより、視覚素ユニットの動きデータを時間軸上で連結するための加重加算手段を含む、請求項1又は請求項2に記載のアニメーションデータ作成プログラム。
- 複数の三つ組視覚素ユニットを含む視覚素コーパスを用い、入力される音声データに対応する顔の動きを示すアニメーションデータを作成するためのアニメーションデータ作成装置であって、
前記三つ組視覚素ユニットの各々は、三つ組視覚素ラベルと、当該三つ組視覚素ユニットに対応する視覚素の継続時間と、当該視覚素を収録したときに発話されていた音声の平均パワーと、当該視覚素を収録したときの発話者の顔の特徴点の動きデータとを含み、
入力される音声データに対して音声分析を行なうことにより、音素ラベル、音素の継続長、及び当該音素の発話時の平均パワーからなる音素データ列を作成するための音素変換手段と、
音素ラベルと視覚素ラベルとの対応関係を示すテーブルを記憶するための手段と、
前記音素データ列に含まれる音素ラベルを、前記テーブルを参照して対応する視覚素ラベルに変換することにより、視覚素データ列を作成するための第1の変換手段と、
前記第1の変換手段の出力する前記視覚素データ列中の視覚素データの各々について、視覚素ラベルを前後の視覚素データの視覚素ラベルと組合せた三つ組視覚素ラベルに変換し、三つ組視覚素データ列を出力するための第2の変換手段と、
前記第2の変換手段の出力する前記三つ組視覚素データ列に含まれる三つ組視覚素データの各々について、前記視覚素コーパスから、前記三つ組視覚素データの有する三つ組視覚素ラベルと一致する三つ組視覚素ラベルを持つ三つ組視覚素ユニットであって、当該三つ組視覚素ユニットの持つ継続長及びパワーと、前記三つ組視覚素データの持つ継続長及び平均パワーとの間の類似度を評価する評価関数によって前記三つ組視覚素データの継続長及び平均パワーと類似する継続長及び平均パワーを持つと評価される三つ組視覚素ユニットを選択するための選択手段と、
前記三つ組視覚素ユニット選択手段により選択された三つ組視覚素ユニットに含まれる顔の動きデータを、前記三つ組視覚素データの時系列にしたがって時間軸上で連結することにより、顔のアニメーションデータを作成するための手段とを含む、アニメーションデータ作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006230543A JP4543263B2 (ja) | 2006-08-28 | 2006-08-28 | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006230543A JP4543263B2 (ja) | 2006-08-28 | 2006-08-28 | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008052628A true JP2008052628A (ja) | 2008-03-06 |
JP4543263B2 JP4543263B2 (ja) | 2010-09-15 |
Family
ID=39236604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006230543A Expired - Fee Related JP4543263B2 (ja) | 2006-08-28 | 2006-08-28 | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4543263B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101153736B1 (ko) | 2010-05-31 | 2012-06-05 | 봉래 박 | 발음기관 애니메이션 생성 장치 및 방법 |
CN103705218A (zh) * | 2013-12-20 | 2014-04-09 | 中国科学院深圳先进技术研究院 | 构音障碍识别的方法、系统和装置 |
JP2016042362A (ja) * | 2013-01-29 | 2016-03-31 | 株式会社東芝 | コンピュータ生成ヘッド |
CN110853614A (zh) * | 2018-08-03 | 2020-02-28 | Tcl集团股份有限公司 | 虚拟对象口型驱动方法、装置及终端设备 |
CN111124579A (zh) * | 2019-12-24 | 2020-05-08 | 北京金山安全软件有限公司 | 一种特效渲染方法、装置、电子设备及存储介质 |
CN111582195A (zh) * | 2020-05-12 | 2020-08-25 | 中国矿业大学(北京) | 一种汉语唇语单音节识别分类器构建方法 |
JP2020184100A (ja) * | 2019-04-26 | 2020-11-12 | 株式会社スクウェア・エニックス | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
JP2021009669A (ja) * | 2019-06-28 | 2021-01-28 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 三次元仮想ポートレートの口形の変化を制御する方法および装置 |
CN113672194A (zh) * | 2020-03-31 | 2021-11-19 | 北京市商汤科技开发有限公司 | 声学特征样本的获取方法、装置、设备以及存储介质 |
JP2022539101A (ja) * | 2019-07-03 | 2022-09-07 | ロブロックス・コーポレーション | テクスチャ操作を使用するアニメーション化された顔 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000011200A (ja) * | 1998-06-19 | 2000-01-14 | Nippon Hoso Kyokai <Nhk> | Cg制御装置 |
JP2002244689A (ja) * | 2001-02-22 | 2002-08-30 | Rikogaku Shinkokai | 平均声の合成方法及び平均声からの任意話者音声の合成方法 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
-
2006
- 2006-08-28 JP JP2006230543A patent/JP4543263B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000011200A (ja) * | 1998-06-19 | 2000-01-14 | Nippon Hoso Kyokai <Nhk> | Cg制御装置 |
JP2002244689A (ja) * | 2001-02-22 | 2002-08-30 | Rikogaku Shinkokai | 平均声の合成方法及び平均声からの任意話者音声の合成方法 |
JP2003208188A (ja) * | 2002-01-15 | 2003-07-25 | Advanced Telecommunication Research Institute International | 日本語テキスト音声合成方法 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101153736B1 (ko) | 2010-05-31 | 2012-06-05 | 봉래 박 | 발음기관 애니메이션 생성 장치 및 방법 |
JP2016042362A (ja) * | 2013-01-29 | 2016-03-31 | 株式会社東芝 | コンピュータ生成ヘッド |
US9959657B2 (en) | 2013-01-29 | 2018-05-01 | Kabushiki Kaisha Toshiba | Computer generated head |
CN103705218A (zh) * | 2013-12-20 | 2014-04-09 | 中国科学院深圳先进技术研究院 | 构音障碍识别的方法、系统和装置 |
CN110853614A (zh) * | 2018-08-03 | 2020-02-28 | Tcl集团股份有限公司 | 虚拟对象口型驱动方法、装置及终端设备 |
JP2020184100A (ja) * | 2019-04-26 | 2020-11-12 | 株式会社スクウェア・エニックス | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
JP7421869B2 (ja) | 2019-04-26 | 2024-01-25 | 株式会社スクウェア・エニックス | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
JP2021009669A (ja) * | 2019-06-28 | 2021-01-28 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 三次元仮想ポートレートの口形の変化を制御する方法および装置 |
US11308671B2 (en) | 2019-06-28 | 2022-04-19 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for controlling mouth shape changes of three-dimensional virtual portrait |
JP2022539101A (ja) * | 2019-07-03 | 2022-09-07 | ロブロックス・コーポレーション | テクスチャ操作を使用するアニメーション化された顔 |
US11645805B2 (en) | 2019-07-03 | 2023-05-09 | Roblox Corporation | Animated faces using texture manipulation |
JP7364702B2 (ja) | 2019-07-03 | 2023-10-18 | ロブロックス・コーポレーション | テクスチャ操作を使用するアニメーション化された顔 |
CN111124579B (zh) * | 2019-12-24 | 2023-12-19 | 北京金山安全软件有限公司 | 一种特效渲染方法、装置、电子设备及存储介质 |
CN111124579A (zh) * | 2019-12-24 | 2020-05-08 | 北京金山安全软件有限公司 | 一种特效渲染方法、装置、电子设备及存储介质 |
CN113672194A (zh) * | 2020-03-31 | 2021-11-19 | 北京市商汤科技开发有限公司 | 声学特征样本的获取方法、装置、设备以及存储介质 |
JP2022530726A (ja) * | 2020-03-31 | 2022-07-01 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | インタラクティブ対象駆動方法、装置、デバイス、及び記録媒体 |
CN111582195A (zh) * | 2020-05-12 | 2020-08-25 | 中国矿业大学(北京) | 一种汉语唇语单音节识别分类器构建方法 |
CN111582195B (zh) * | 2020-05-12 | 2024-01-26 | 中国矿业大学(北京) | 一种汉语唇语单音节识别分类器构建方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4543263B2 (ja) | 2010-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4543263B2 (ja) | アニメーションデータ作成装置及びアニメーションデータ作成プログラム | |
US20210142818A1 (en) | System and method for animated lip synchronization | |
JP4631078B2 (ja) | リップシンクアニメーション作成用の統計確率モデル作成装置、パラメータ系列合成装置、リップシンクアニメーション作成システム、及びコンピュータプログラム | |
Ezzat et al. | Miketalk: A talking facial display based on morphing visemes | |
Cao et al. | Expressive speech-driven facial animation | |
JP3664474B2 (ja) | 視覚的スピーチの言語透過的合成 | |
US7133535B2 (en) | System and method for real time lip synchronization | |
US7990384B2 (en) | Audio-visual selection process for the synthesis of photo-realistic talking-head animations | |
US20060290699A1 (en) | System and method for audio-visual content synthesis | |
US20020024519A1 (en) | System and method for producing three-dimensional moving picture authoring tool supporting synthesis of motion, facial expression, lip synchronizing and lip synchronized voice of three-dimensional character | |
JP2003529861A5 (ja) | ||
KR20080018408A (ko) | 음성 사운드 소스를 이용한 얼굴 표정 변화 프로그램을기록한 컴퓨터에서 읽을 수 있는 기록매체 | |
CA2959862A1 (en) | System and method for animated lip synchronization | |
US20240177391A1 (en) | System and method of modulating animation curves | |
JP4379616B2 (ja) | モーションキャプチャデータ補正装置、マルチモーダルコーパス作成システム、画像合成装置、及びコンピュータプログラム | |
JP4631077B2 (ja) | アニメーション作成装置 | |
Železný et al. | Design, implementation and evaluation of the Czech realistic audio-visual speech synthesis | |
Brooke et al. | Two-and three-dimensional audio-visual speech synthesis | |
Beskow et al. | Data-driven synthesis of expressive visual speech using an MPEG-4 talking head. | |
JP4617500B2 (ja) | リップシンクアニメーション作成装置、コンピュータプログラム及び顔モデル生成装置 | |
JP2009216724A (ja) | 音声生成装置及びコンピュータプログラム | |
Bailly et al. | Lip-synching using speaker-specific articulation, shape and appearance models | |
Theobald | Audiovisual speech synthesis | |
Martin et al. | 3D audiovisual rendering and real-time interactive control of expressivity in a talking head | |
JP2009216723A (ja) | 類似音声選択装置、音声生成装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100525 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100614 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |