JP3351987B2 - Cg俳優像生成装置 - Google Patents
Cg俳優像生成装置Info
- Publication number
- JP3351987B2 JP3351987B2 JP13344297A JP13344297A JP3351987B2 JP 3351987 B2 JP3351987 B2 JP 3351987B2 JP 13344297 A JP13344297 A JP 13344297A JP 13344297 A JP13344297 A JP 13344297A JP 3351987 B2 JP3351987 B2 JP 3351987B2
- Authority
- JP
- Japan
- Prior art keywords
- actor image
- actor
- voice
- image
- mouth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
CG俳優像を生成し、特に、コンピュータのマン−マシ
ンインターフェースの一つとして喋るCG俳優像を生成
するCG俳優像生成装置に関する。
声合成装置により生成された読み上げ音声と、CG的手
法により生成されたCG俳優像の口の開け方とを同期さ
せる従来の技術としては、人間が読み上げ音声を聞きな
がら、特別に用意された操作機を使ってCG俳優像の口
の開け方を実時間で制御する方法がある。しかし、この
方法では、人手が必要であり自動的に行うことができな
い。
いったん録音して、これを解析してCG俳優像の口の開
け方を計算し、これをもとに喋るCG俳優像を作り出す
方法がある。しかし、この方法では、原理的に実時間の
CG俳優像生成装置を構成することができない。
字情報を、CG俳優像生成装置にも同時に転送し、音声
合成装置から出力されるトリガ信号をもとにCG俳優像
の口の開け方を制御する方法がある。しかし、この方法
では、音節あるいは音素単位でトリガ信号を出力するこ
とのできる機能を持った特殊な音声合成装置が必要とな
る。また、音節、音素単位のトリガ信号だけでは、CG
俳優像側で割り当てられた音節の時間的長さと、実際に
音声合成装置で発生された音節の時間的長さとが食い違
うことがあり、従って、口の開け方と合成音声の正確な
同期を取ることが難しく、得られたCG俳優像が不自然
に見えることがあった。
るCG俳優像を生成するCG俳優像生成装置を提供する
ことにある。
め、本発明CG俳優像生成装置は、音声合成装置により
生成された読み上げ音声に同期させて、CG的手法によ
り生成されたCG俳優像に前記読み上げ音声を喋らせる
CG俳優像生成装置において、前記読み上げ音声の信号
を少なくとも整流手段と低域通過濾波手段に通した信号
によって前記CG俳優像の口を開ける量が実時間制御さ
れるように構成したことを特徴とするものである。
合成装置により生成された読み上げ音声に同期させて、
CG的手法により生成されたCG俳優像に前記読み上げ
音声を喋らせるCG俳優像生成装置において、前記読み
上げ音声の信号を少なくとも整流手段と低域通過濾波手
段に通した信号によって前記CG俳優像の口を開ける量
および頭を傾ける量が実時間制御されるように構成した
ことを特徴とするものである。
げ音声の信号を整流、高周波成分阻止・平滑化し、得ら
れた信号のレベルを用いてCG俳優像の口を開ける量を
制御しているため、実時間制御であると同時に、人手が
要らず自動的に声と口の同期が行われる。また、生成さ
れたCG俳優像は音声合成装置の読み上げ音声に比例し
た大きさに口を開けるので、大きい声のときに大きな口
を開け、小さい声のときには小さな口を開ける、という
動作になり、視覚的に見ても比較的自然なCG俳優像が
得られる。また、特殊な音声合成装置は必要なく、装置
の回路規模が小さく、簡易なハードウェアで実時間で動
作するCG俳優像生成装置を実現することができる。
実施の形態に基づいて本発明を詳細に説明する。以下に
説明する本発明CG俳優像生成装置の一実施形態では、
ユーザがパーソナルコンピュータによるエディタ(編集
機)などを使って入力した文章を、CG俳優像が読み上
げるように構成した場合についてとする。
を示している。図1において、1はパーソナルコンピュ
ータ、2は音声合成装置、3はスピーカ、4は整流器、
5は低域通過フィルタ、6はA/D変換器、7はCG俳
優像制御装置、および8は映像モニタである。
ンピュータ1にソフトウェアとして搭載されたエディタ
を使ってユーザが文章を入力し、この文章が音声合成装
置2に入力され、同装置から音声合成出力としての読み
上げ音声の信号(a)が得られる。この読み上げ音声の
信号(a)は、スピーカ3に入力されCG俳優像の音声
として出力されるとともに、整流器4にも入力される。
整流器4により整流された信号(b)は、低域通過フィ
ルタ5により高周波成分阻止・平滑化(波形整形の一
種)され、高周波成分阻止・平滑化された信号(c)
は、A/D変換器6に入力され、ディジタルデータ
(d)に変換される。
合、音声「あした」を合成するものとする。)、整流さ
れた音声の信号(b)、および高周波成分阻止・平滑化
された信号(c)(いずれも、アナログ信号である。)
は、それぞれ信号波形図(a),(b)および(c)と
して図2に示されている(縦軸はともにレベル、横軸は
時間を示している)。同図を参照するに、音声合成装置
2の出力信号、すなわち読み上げ音声の信号(a)は交
流信号である。これを整流器4によって整流して得られ
た出力信号(b)は高周波成分を含んでいるとともに、
母音、子音を特定する多くの周波数成分が含まれてい
る。一方、CG俳優像の口の開け具合は、母音、子音に
よらない音声の大きさのみによって制御することとして
いるので、高周波成分を低域通過フィルタ5によって阻
止し、かつ平滑化して音声の大きさのみに対応した信号
(c)を得ている。
G俳優像があらかじめ入力されており、このCG俳優像
の口を開ける大きさが、ディジタルデータ(d)の数値
によって制御され、この制御に基づいてCG俳優像の口
を開閉することにより、音声合成装置2からの読み上げ
音声の信号に実時間で同期したCG俳優像が映像モニタ
8の画面上に映出される。
施形態として、CG俳優像制御装置7においては、単に
CG俳優像の口を開ける量のみでなく、同時に頭部を傾
ける傾き角をも制御することにより、一層自然に見える
ようにすることができる。これにつきCG俳優像を側面
から簡略化して示した図3を参照して説明する。
部Aと、下顎Bと、体Cの3つの部品からなり、また、
頭部Aは接点Dで体Cと接続され、下顎Bは頭部Aに対
し下向きに平行移動するように作られているものとす
る。具体的には、各部品の空間座標を指定することによ
りCG俳優像の姿態が決まり、その空間座標を与えられ
たデータに基づいて計算されるパラメータでリアルタイ
ム制御することよりCG俳優像に動きが与えられる。い
ま、頭部Aが接点Dを回転軸として、垂直に対して後ろ
に傾く角度をl、下顎Bが頭部Aに対して下向きに平行
移動する距離をmとする。このとき、CG俳優像制御装
置7に供給されるデータ(A/D変換器6の出力)をp
とすると、上記l,mはそれぞれ次の式で計算される。 l = k1×p m = k2×p ここで、k1は頭部Aを傾ける際の感度を決定する定数
であり、k2は下顎Bを開ける際の感度を決定する定数
であり、ともに視覚的に自然になるように適宜設定す
る。
は、CG俳優像があらかじめ入力されていて、A/D変
換器6の出力によって、CG俳優像の口を開ける量、さ
らには頭を傾ける量を制御するものとしたが、このCG
俳優像制御装置7自体が、CG俳優像を生成する機能を
兼ね具えたCG俳優像生成装置となっていてもよいこと
は勿論である。また、本発明は、その動作原理からし
て、アナログ信号、ディジタル信号の別を問わない。
み上げ音声の信号を用いるCG俳優像の口を開ける量を
制御することで、人手が要らず、自動的に声と口の同期
が行われるため、コンピュータのマン−マシンインター
フェースのひとつとして、喋るCGキャラクタの生成な
どへの応用が可能となる。
合成装置からの読み上げ音声に比例した大きさに口を開
けるので、大きい声のときに大きな口を開け、小さい声
のときには小さな口を開ける、という動作になり、視覚
的に見ても比較的自然なCG俳優像が得られる。さら
に、読み上げ音声に比例した角度で頭を傾ける動作を付
加することによって一層効果的になる。
らの音節、音素単位のトリガ信号などの取り出しを必要
としないため、高級な音声合成装置は必要でなく、簡易
なハードウェアで実時間で動作する音声合成装置を使用
することができ、CG俳優像生成装置全体を廉価に製造
することができる。
ック構成図を示している。
している。
Claims (2)
- 【請求項1】 音声合成装置により生成された読み上げ
音声に同期させて、CG的手法により生成されたCG俳
優像に前記読み上げ音声を喋らせるCG俳優像生成装置
において、前記読み上げ音声の信号を少なくとも整流手
段と低域通過濾波手段に通した信号によって前記CG俳
優像の口を開ける量が実時間制御されるように構成した
ことを特徴とするCG俳優像生成装置。 - 【請求項2】 音声合成装置により生成された読み上げ
音声に同期させて、CG的手法により生成されたCG俳
優像に前記読み上げ音声を喋らせるCG俳優像生成装置
において、前記読み上げ音声の信号を少なくとも整流手
段と低域通過濾波手段に通した信号によって前記CG俳
優像の口を開ける量および頭を傾ける量が実時間制御さ
れるように構成したことを特徴とするCG俳優像生成装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13344297A JP3351987B2 (ja) | 1997-05-23 | 1997-05-23 | Cg俳優像生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13344297A JP3351987B2 (ja) | 1997-05-23 | 1997-05-23 | Cg俳優像生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10326354A JPH10326354A (ja) | 1998-12-08 |
JP3351987B2 true JP3351987B2 (ja) | 2002-12-03 |
Family
ID=15104879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13344297A Expired - Lifetime JP3351987B2 (ja) | 1997-05-23 | 1997-05-23 | Cg俳優像生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3351987B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002133444A (ja) * | 2000-10-20 | 2002-05-10 | Matsushita Electric Ind Co Ltd | 映像情報作成装置 |
-
1997
- 1997-05-23 JP JP13344297A patent/JP3351987B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH10326354A (ja) | 1998-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6109923A (en) | Method and apparatus for teaching prosodic features of speech | |
US5278943A (en) | Speech animation and inflection system | |
Stevens et al. | Constraints among parameters simplify control of Klatt formant synthesizer | |
JP2518683B2 (ja) | 画像合成方法及びその装置 | |
EP0860811A2 (en) | Automated speech alignment for image synthesis | |
JPH11339058A (ja) | 人物像対話装置及び人物像対話プログラムを記録した記録媒体 | |
US20020049594A1 (en) | Speech synthesis | |
Waters et al. | An automatic lip-synchronization algorithm for synthetic faces | |
JP4032273B2 (ja) | 同期制御装置および方法、並びに記録媒体 | |
US7315820B1 (en) | Text-derived speech animation tool | |
JP3351987B2 (ja) | Cg俳優像生成装置 | |
Waters et al. | DECface: A system for synthetic face applications | |
Hallgren et al. | Visual speech synthesis with concatenative speech | |
AU769036B2 (en) | Device and method for digital voice processing | |
WO2023276539A1 (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
KR100754430B1 (ko) | 음성 기반 자동 립싱크 애니메이션 장치와 방법 및 기록매체 | |
JPH06348811A (ja) | 動画像表示装置 | |
JP6424419B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
JP3785892B2 (ja) | 音声合成装置及び記録媒体 | |
Gully et al. | Modeling voiced stop consonants using the 3D dynamic digital waveguide mesh vocal tract model | |
Engwall | Making the tongue model talk: merging MRI & EMA measurements | |
Badin et al. | Virtual Talking Heads and audiovisual articulatory synthesis | |
JP2003296753A (ja) | 聴覚障害者用対話システム | |
JP5381994B2 (ja) | 情報処理装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020813 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090920 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100920 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110920 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120920 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120920 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130920 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140920 Year of fee payment: 12 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |