JP3351987B2 - Cg俳優像生成装置 - Google Patents

Cg俳優像生成装置

Info

Publication number
JP3351987B2
JP3351987B2 JP13344297A JP13344297A JP3351987B2 JP 3351987 B2 JP3351987 B2 JP 3351987B2 JP 13344297 A JP13344297 A JP 13344297A JP 13344297 A JP13344297 A JP 13344297A JP 3351987 B2 JP3351987 B2 JP 3351987B2
Authority
JP
Japan
Prior art keywords
actor image
actor
voice
image
mouth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP13344297A
Other languages
English (en)
Other versions
JPH10326354A (ja
Inventor
林  正樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP13344297A priority Critical patent/JP3351987B2/ja
Publication of JPH10326354A publication Critical patent/JPH10326354A/ja
Application granted granted Critical
Publication of JP3351987B2 publication Critical patent/JP3351987B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、CG的手法により
CG俳優像を生成し、特に、コンピュータのマン−マシ
ンインターフェースの一つとして喋るCG俳優像を生成
するCG俳優像生成装置に関する。
【0002】
【従来の技術、および発明が解決しようとする課題】音
声合成装置により生成された読み上げ音声と、CG的手
法により生成されたCG俳優像の口の開け方とを同期さ
せる従来の技術としては、人間が読み上げ音声を聞きな
がら、特別に用意された操作機を使ってCG俳優像の口
の開け方を実時間で制御する方法がある。しかし、この
方法では、人手が必要であり自動的に行うことができな
い。
【0003】また、音声合成装置からの読み上げ音声を
いったん録音して、これを解析してCG俳優像の口の開
け方を計算し、これをもとに喋るCG俳優像を作り出す
方法がある。しかし、この方法では、原理的に実時間の
CG俳優像生成装置を構成することができない。
【0004】また、音声合成装置に送られる読み上げ文
字情報を、CG俳優像生成装置にも同時に転送し、音声
合成装置から出力されるトリガ信号をもとにCG俳優像
の口の開け方を制御する方法がある。しかし、この方法
では、音節あるいは音素単位でトリガ信号を出力するこ
とのできる機能を持った特殊な音声合成装置が必要とな
る。また、音節、音素単位のトリガ信号だけでは、CG
俳優像側で割り当てられた音節の時間的長さと、実際に
音声合成装置で発生された音節の時間的長さとが食い違
うことがあり、従って、口の開け方と合成音声の正確な
同期を取ることが難しく、得られたCG俳優像が不自然
に見えることがあった。
【0005】本発明の目的は、上記各課題を含まない喋
るCG俳優像を生成するCG俳優像生成装置を提供する
ことにある。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明CG俳優像生成装置は、音声合成装置により
生成された読み上げ音声に同期させて、CG的手法によ
り生成されたCG俳優像に前記読み上げ音声を喋らせる
CG俳優像生成装置において、前記読み上げ音声の信号
を少なくとも整流手段と低域通過濾波手段に通した信号
によって前記CG俳優像の口を開ける量が実時間制御さ
れるように構成したことを特徴とするものである。
【0007】また、本発明CG俳優像生成装置は、音声
合成装置により生成された読み上げ音声に同期させて、
CG的手法により生成されたCG俳優像に前記読み上げ
音声を喋らせるCG俳優像生成装置において、前記読み
上げ音声の信号を少なくとも整流手段と低域通過濾波手
段に通した信号によって前記CG俳優像の口を開ける量
および頭を傾ける量が実時間制御されるように構成した
ことを特徴とするものである。
【0008】以上によれば、音声合成装置からの読み上
げ音声の信号を整流、高周波成分阻止・平滑化し、得ら
れた信号のレベルを用いてCG俳優像の口を開ける量を
制御しているため、実時間制御であると同時に、人手が
要らず自動的に声と口の同期が行われる。また、生成さ
れたCG俳優像は音声合成装置の読み上げ音声に比例し
た大きさに口を開けるので、大きい声のときに大きな口
を開け、小さい声のときには小さな口を開ける、という
動作になり、視覚的に見ても比較的自然なCG俳優像が
得られる。また、特殊な音声合成装置は必要なく、装置
の回路規模が小さく、簡易なハードウェアで実時間で動
作するCG俳優像生成装置を実現することができる。
【0009】
【発明の実施の形態】以下に添付図面を参照し、発明の
実施の形態に基づいて本発明を詳細に説明する。以下に
説明する本発明CG俳優像生成装置の一実施形態では、
ユーザがパーソナルコンピュータによるエディタ(編集
機)などを使って入力した文章を、CG俳優像が読み上
げるように構成した場合についてとする。
【0010】図1は、この場合の装置のブロック構成図
を示している。図1において、1はパーソナルコンピュ
ータ、2は音声合成装置、3はスピーカ、4は整流器、
5は低域通過フィルタ、6はA/D変換器、7はCG俳
優像制御装置、および8は映像モニタである。
【0011】次に、動作につき説明する。パーソナルコ
ンピュータ1にソフトウェアとして搭載されたエディタ
を使ってユーザが文章を入力し、この文章が音声合成装
置2に入力され、同装置から音声合成出力としての読み
上げ音声の信号(a)が得られる。この読み上げ音声の
信号(a)は、スピーカ3に入力されCG俳優像の音声
として出力されるとともに、整流器4にも入力される。
整流器4により整流された信号(b)は、低域通過フィ
ルタ5により高周波成分阻止・平滑化(波形整形の一
種)され、高周波成分阻止・平滑化された信号(c)
は、A/D変換器6に入力され、ディジタルデータ
(d)に変換される。
【0012】上記読み上げ音声の信号(a)(本例の場
合、音声「あした」を合成するものとする。)、整流さ
れた音声の信号(b)、および高周波成分阻止・平滑化
された信号(c)(いずれも、アナログ信号である。)
は、それぞれ信号波形図(a),(b)および(c)と
して図2に示されている(縦軸はともにレベル、横軸は
時間を示している)。同図を参照するに、音声合成装置
2の出力信号、すなわち読み上げ音声の信号(a)は交
流信号である。これを整流器4によって整流して得られ
た出力信号(b)は高周波成分を含んでいるとともに、
母音、子音を特定する多くの周波数成分が含まれてい
る。一方、CG俳優像の口の開け具合は、母音、子音に
よらない音声の大きさのみによって制御することとして
いるので、高周波成分を低域通過フィルタ5によって阻
止し、かつ平滑化して音声の大きさのみに対応した信号
(c)を得ている。
【0013】一方、CG俳優像制御装置7においてはC
G俳優像があらかじめ入力されており、このCG俳優像
の口を開ける大きさが、ディジタルデータ(d)の数値
によって制御され、この制御に基づいてCG俳優像の口
を開閉することにより、音声合成装置2からの読み上げ
音声の信号に実時間で同期したCG俳優像が映像モニタ
8の画面上に映出される。
【0014】また、本発明CG俳優像生成装置の他の実
施形態として、CG俳優像制御装置7においては、単に
CG俳優像の口を開ける量のみでなく、同時に頭部を傾
ける傾き角をも制御することにより、一層自然に見える
ようにすることができる。これにつきCG俳優像を側面
から簡略化して示した図3を参照して説明する。
【0015】ここでは、CG俳優像は、下顎を除いた頭
部Aと、下顎Bと、体Cの3つの部品からなり、また、
頭部Aは接点Dで体Cと接続され、下顎Bは頭部Aに対
し下向きに平行移動するように作られているものとす
る。具体的には、各部品の空間座標を指定することによ
りCG俳優像の姿態が決まり、その空間座標を与えられ
たデータに基づいて計算されるパラメータでリアルタイ
ム制御することよりCG俳優像に動きが与えられる。い
ま、頭部Aが接点Dを回転軸として、垂直に対して後ろ
に傾く角度をl、下顎Bが頭部Aに対して下向きに平行
移動する距離をmとする。このとき、CG俳優像制御装
置7に供給されるデータ(A/D変換器6の出力)をp
とすると、上記l,mはそれぞれ次の式で計算される。 l = k1×p m = k2×p ここで、k1は頭部Aを傾ける際の感度を決定する定数
であり、k2は下顎Bを開ける際の感度を決定する定数
であり、ともに視覚的に自然になるように適宜設定す
る。
【0016】以上においては、CG俳優像制御装置7
は、CG俳優像があらかじめ入力されていて、A/D変
換器6の出力によって、CG俳優像の口を開ける量、さ
らには頭を傾ける量を制御するものとしたが、このCG
俳優像制御装置7自体が、CG俳優像を生成する機能を
兼ね具えたCG俳優像生成装置となっていてもよいこと
は勿論である。また、本発明は、その動作原理からし
て、アナログ信号、ディジタル信号の別を問わない。
【0017】
【発明の効果】本発明によれば、音声合成装置からの読
み上げ音声の信号を用いるCG俳優像の口を開ける量を
制御することで、人手が要らず、自動的に声と口の同期
が行われるため、コンピュータのマン−マシンインター
フェースのひとつとして、喋るCGキャラクタの生成な
どへの応用が可能となる。
【0018】また、本発明によれば、CG俳優像が音声
合成装置からの読み上げ音声に比例した大きさに口を開
けるので、大きい声のときに大きな口を開け、小さい声
のときには小さな口を開ける、という動作になり、視覚
的に見ても比較的自然なCG俳優像が得られる。さら
に、読み上げ音声に比例した角度で頭を傾ける動作を付
加することによって一層効果的になる。
【0019】さらに、本発明によれば、音声合成装置か
らの音節、音素単位のトリガ信号などの取り出しを必要
としないため、高級な音声合成装置は必要でなく、簡易
なハードウェアで実時間で動作する音声合成装置を使用
することができ、CG俳優像生成装置全体を廉価に製造
することができる。
【図面の簡単な説明】
【図1】本発明CG俳優像生成装置の一実施形態のブロ
ック構成図を示している。
【図2】図1の構成中、各部信号波形図を示している。
【図3】本発明CG俳優像生成装置の他の実施形態を示
している。
【符号の説明】
1 パーソナルコンピュータ 2 音声合成装置 3 スピーカ 4 整流器 5 低域通過フィルタ 6 A/D変換器 7 CG俳優像制御装置 8 映像モニタ A CG俳優像の頭部 B CG俳優像の下顎 C CG俳優像の体 D CG俳優像の頭部と体の接点

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声合成装置により生成された読み上げ
    音声に同期させて、CG的手法により生成されたCG俳
    優像に前記読み上げ音声を喋らせるCG俳優像生成装置
    において、前記読み上げ音声の信号を少なくとも整流手
    段と低域通過濾波手段に通した信号によって前記CG俳
    優像の口を開ける量が実時間制御されるように構成した
    ことを特徴とするCG俳優像生成装置。
  2. 【請求項2】 音声合成装置により生成された読み上げ
    音声に同期させて、CG的手法により生成されたCG俳
    優像に前記読み上げ音声を喋らせるCG俳優像生成装置
    において、前記読み上げ音声の信号を少なくとも整流手
    段と低域通過濾波手段に通した信号によって前記CG俳
    優像の口を開ける量および頭を傾ける量が実時間制御さ
    れるように構成したことを特徴とするCG俳優像生成装
    置。
JP13344297A 1997-05-23 1997-05-23 Cg俳優像生成装置 Expired - Lifetime JP3351987B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13344297A JP3351987B2 (ja) 1997-05-23 1997-05-23 Cg俳優像生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13344297A JP3351987B2 (ja) 1997-05-23 1997-05-23 Cg俳優像生成装置

Publications (2)

Publication Number Publication Date
JPH10326354A JPH10326354A (ja) 1998-12-08
JP3351987B2 true JP3351987B2 (ja) 2002-12-03

Family

ID=15104879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13344297A Expired - Lifetime JP3351987B2 (ja) 1997-05-23 1997-05-23 Cg俳優像生成装置

Country Status (1)

Country Link
JP (1) JP3351987B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002133444A (ja) * 2000-10-20 2002-05-10 Matsushita Electric Ind Co Ltd 映像情報作成装置

Also Published As

Publication number Publication date
JPH10326354A (ja) 1998-12-08

Similar Documents

Publication Publication Date Title
US6109923A (en) Method and apparatus for teaching prosodic features of speech
US5278943A (en) Speech animation and inflection system
Stevens et al. Constraints among parameters simplify control of Klatt formant synthesizer
JP2518683B2 (ja) 画像合成方法及びその装置
EP0860811A2 (en) Automated speech alignment for image synthesis
JPH11339058A (ja) 人物像対話装置及び人物像対話プログラムを記録した記録媒体
US20020049594A1 (en) Speech synthesis
Waters et al. An automatic lip-synchronization algorithm for synthetic faces
JP4032273B2 (ja) 同期制御装置および方法、並びに記録媒体
US7315820B1 (en) Text-derived speech animation tool
JP3351987B2 (ja) Cg俳優像生成装置
Waters et al. DECface: A system for synthetic face applications
Hallgren et al. Visual speech synthesis with concatenative speech
AU769036B2 (en) Device and method for digital voice processing
WO2023276539A1 (ja) 音声変換装置、音声変換方法、プログラム、および記録媒体
KR100754430B1 (ko) 음성 기반 자동 립싱크 애니메이션 장치와 방법 및 기록매체
JPH06348811A (ja) 動画像表示装置
JP6424419B2 (ja) 音声制御装置、音声制御方法およびプログラム
JP3785892B2 (ja) 音声合成装置及び記録媒体
Gully et al. Modeling voiced stop consonants using the 3D dynamic digital waveguide mesh vocal tract model
Engwall Making the tongue model talk: merging MRI & EMA measurements
Badin et al. Virtual Talking Heads and audiovisual articulatory synthesis
JP2003296753A (ja) 聴覚障害者用対話システム
JP5381994B2 (ja) 情報処理装置
JP2577372B2 (ja) 音声合成装置および方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020813

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090920

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100920

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110920

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120920

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120920

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130920

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140920

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term