JP7421869B2 - 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 - Google Patents
情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 Download PDFInfo
- Publication number
- JP7421869B2 JP7421869B2 JP2019086481A JP2019086481A JP7421869B2 JP 7421869 B2 JP7421869 B2 JP 7421869B2 JP 2019086481 A JP2019086481 A JP 2019086481A JP 2019086481 A JP2019086481 A JP 2019086481A JP 7421869 B2 JP7421869 B2 JP 7421869B2
- Authority
- JP
- Japan
- Prior art keywords
- facial expression
- audio data
- adjustment
- information processing
- preprocessed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 45
- 238000000034 method Methods 0.000 title claims description 39
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000008921 facial expression Effects 0.000 claims description 135
- 238000007781 pre-processing Methods 0.000 claims description 33
- 230000008859 change Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 20
- 239000000523 sample Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 9
- 210000004709 eyebrow Anatomy 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 5
- 208000004350 Strabismus Diseases 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 210000003128 head Anatomy 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
以下において、本発明の一実施形態に係る情報処理装置について説明を行う。図1は、本発明に係る情報処理装置の構成の例を示すブロック図である。図1に示すように、情報処理装置10は、音声データ取得部11と、前処理部12と、表情パラメータ生成部13と、記憶部14とを備える。図2は、本発明の実施形態の少なくとも一つに対応するニューラルネットワークの概念を表した説明図である。この図2に示すように、本例では、音声データを前処理することで得た前処理済音声データをニューラルネットワークに入力して、適切に学習が済まされたニューラルネットワークに表情パラメータを出力させる構成となっている。
第1の実施の形態においては、表情パラメータ生成部13で生成された表情パラメータに基づいて直接リップシンクアニメーションを生成するものとして説明を行ったが、俺に限定されるものではなく、表情パラメータ生成部13で生成された表情パラメータをさらに調整するようにしてもよい。
11 音声データ取得部
12 前処理部
13 表情パラメータ生成部
14 記憶部
15 表情パラメータ調整部
Claims (5)
- 人の声を録音した音声データに基づいてアニメーションのキャラクタの口の動きを含む表情をコントロールするための表情パラメータを出力する処理をコンピュータに実現させるための情報処理プログラムであって、
前記コンピュータに、
前記音声データを取得する音声データ取得機能と、
取得した前記音声データに対して所定の前処理を行って前処理済音声データを得る前処理機能と、
入力された音声データに基づいて前記表情パラメータを出力することについて予め学習を行った学習済モデルに基づいて、前記前処理済音声データを入力として前記表情パラメータを生成して出力する表情パラメータ生成機能と、
音声データ又は前処理済音声データから所定の調整候補個所を抽出して、抽出した調整候補個所が調整の必要があると判断した場合には、当該調整候補個所に該当する表情パラメータの値を所定の調整内容となるように変更する表情パラメータ調整機能と
を実現させる情報処理プログラム。 - 前記表情パラメータ調整機能は、
音声データ又は前処理済音声データから予め登録した特徴を備えた調整候補箇所を抽出して、抽出した調整候補個所に対応する表情パラメータが所定の条件から逸脱していて調整の必要があると判断した場合には、当該調整候補個所に対応する表情パラメータの値を前記所定の条件に合致するように変更する
請求項1記載の情報処理プログラム。 - 前記表情パラメータ調整機能は、
音声データ又は前処理済音声データから無音個所を抽出して、抽出した無音箇所に対応する表情パラメータが口を開いているものであると判定された場合には、当該無音個所に該当する表情パラメータの値を口を閉じた状態の値となるように変更する
請求項1記載の情報処理プログラム。 - 人の声を録音した音声データに基づいてアニメーションのキャラクタの口の動きを含む表情をコントロールするための表情パラメータを出力するための情報処理装置であって、
前記音声データを取得する音声データ取得部と、
取得した前記音声データに対して所定の前処理を行って前処理済音声データを得る前処理部と、
入力された音声データに基づいて前記表情パラメータを出力することについて予め学習を行った学習済モデルに基づいて、前記前処理済音声データを入力として前記表情パラメータを生成して出力する表情パラメータ生成部と、
音声データ又は前処理済音声データから所定の調整候補個所を抽出して、抽出した調整候補個所が調整の必要があると判断した場合には、当該調整候補個所に該当する表情パラメータの値を所定の調整内容となるように変更する表情パラメータ調整部と
を備える情報処理装置。 - コンピュータに複数手順を実行させることで、人の声を録音した音声データに基づいてアニメーションのキャラクタの口の動きを含む表情をコントロールするための表情パラメータを出力する処理を実現させるための情報処理方法であって、
前記音声データを取得する音声データ取得手順と、
取得した前記音声データに対して所定の前処理を行って前処理済音声データを得る前処理手順と、
入力された音声データに基づいて前記表情パラメータを出力することについて予め学習を行った学習済モデルに基づいて、前記前処理済音声データを入力として前記表情パラメータを生成して出力する表情パラメータ生成手順と、
音声データ又は前処理済音声データから所定の調整候補個所を抽出して、抽出した調整候補個所が調整の必要があると判断した場合には、当該調整候補個所に該当する表情パラメータの値を所定の調整内容となるように変更する表情パラメータ調整手順と
を含む情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019086481A JP7421869B2 (ja) | 2019-04-26 | 2019-04-26 | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019086481A JP7421869B2 (ja) | 2019-04-26 | 2019-04-26 | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020184100A JP2020184100A (ja) | 2020-11-12 |
JP7421869B2 true JP7421869B2 (ja) | 2024-01-25 |
Family
ID=73045207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019086481A Active JP7421869B2 (ja) | 2019-04-26 | 2019-04-26 | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7421869B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6993034B1 (ja) | 2021-05-14 | 2022-01-13 | Aiインフルエンサー株式会社 | コンテンツ再生方法、及びコンテンツ再生システム |
JPWO2023032224A1 (ja) * | 2021-09-06 | 2023-03-09 | ||
KR102558530B1 (ko) * | 2021-11-25 | 2023-07-24 | 주식회사 마음에이아이 | 립싱크 영상 생성을 위한 인공 신경망 학습 방법 및 컴퓨터 프로그램 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001126077A (ja) | 1999-10-26 | 2001-05-11 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 顔画像伝送方法およびシステムならびに当該システムで用いられる顔画像送信装置および顔画像再生装置 |
JP2005070367A (ja) | 2003-08-22 | 2005-03-17 | Sharp Corp | 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラムおよび音声認識プログラム、記録媒体、並びに電子機器 |
JP2007058846A (ja) | 2005-07-27 | 2007-03-08 | Advanced Telecommunication Research Institute International | リップシンクアニメーション作成用の統計確率モデル作成装置、パラメータ系列合成装置、リップシンクアニメーション作成システム、及びコンピュータプログラム |
JP2008052628A (ja) | 2006-08-28 | 2008-03-06 | Advanced Telecommunication Research Institute International | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
US20100211397A1 (en) | 2009-02-18 | 2010-08-19 | Park Chi-Youn | Facial expression representation apparatus |
JP2016173791A (ja) | 2015-03-18 | 2016-09-29 | カシオ計算機株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2019
- 2019-04-26 JP JP2019086481A patent/JP7421869B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001126077A (ja) | 1999-10-26 | 2001-05-11 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 顔画像伝送方法およびシステムならびに当該システムで用いられる顔画像送信装置および顔画像再生装置 |
JP2005070367A (ja) | 2003-08-22 | 2005-03-17 | Sharp Corp | 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラムおよび音声認識プログラム、記録媒体、並びに電子機器 |
JP2007058846A (ja) | 2005-07-27 | 2007-03-08 | Advanced Telecommunication Research Institute International | リップシンクアニメーション作成用の統計確率モデル作成装置、パラメータ系列合成装置、リップシンクアニメーション作成システム、及びコンピュータプログラム |
JP2008052628A (ja) | 2006-08-28 | 2008-03-06 | Advanced Telecommunication Research Institute International | アニメーションデータ作成装置及びアニメーションデータ作成プログラム |
US20100211397A1 (en) | 2009-02-18 | 2010-08-19 | Park Chi-Youn | Facial expression representation apparatus |
JP2016173791A (ja) | 2015-03-18 | 2016-09-29 | カシオ計算機株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
西村 亮佑 Ryosuke NISHIMURA,深層学習を用いた入力音声に適した顔表情生成,第23回日本バーチャルリアリティ学会大会 [online] The 23<SP>rd</SP> Annual Conference of the Virtual Reality Society of Japan,2018年09月21日,13C-3 |
Also Published As
Publication number | Publication date |
---|---|
JP2020184100A (ja) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210142818A1 (en) | System and method for animated lip synchronization | |
US11211060B2 (en) | Using machine-learning models to determine movements of a mouth corresponding to live speech | |
JP7421869B2 (ja) | 情報処理プログラム、情報処理装置、情報処理方法及び学習済モデル生成方法 | |
Vougioukas et al. | Video-driven speech reconstruction using generative adversarial networks | |
KR20060090687A (ko) | 시청각 콘텐츠 합성을 위한 시스템 및 방법 | |
GB2516965A (en) | Synthetic audiovisual storyteller | |
JP2005049859A (ja) | オーディオデータを自動的に認識する方法及び装置 | |
CN112184859B (zh) | 端到端的虚拟对象动画生成方法及装置、存储介质、终端 | |
Ishi et al. | Speech-driven lip motion generation for tele-operated humanoid robots | |
Llorach et al. | Web-based live speech-driven lip-sync | |
WO2023279976A1 (zh) | 语音合成方法、装置、设备及存储介质 | |
CA2959862A1 (en) | System and method for animated lip synchronization | |
CN113822968A (zh) | 语音实时驱动虚拟人的方法、系统及存储介质 | |
CN113823323A (zh) | 一种基于卷积神经网络的音频处理方法、装置及相关设备 | |
CN108847246A (zh) | 一种动画制作方法、装置、终端及可读介质 | |
CN117523051B (zh) | 基于音频生成动态图像的方法、装置、设备及存储介质 | |
JP2015038725A (ja) | 発話アニメーション生成装置、方法、及びプログラム | |
CN116095357B (zh) | 虚拟主播的直播方法、装置及系统 | |
CN114708857A (zh) | 语音识别模型训练方法、语音识别方法及相应装置 | |
CN112712789A (zh) | 跨语言音频转换方法、装置、计算机设备和存储介质 | |
CN116366872A (zh) | 基于中之人和人工智能的直播方法、装置及系统 | |
KR20230172427A (ko) | 사람 음성에 따른 실사인물의 발화 영상 합성 시스템 | |
US11461948B2 (en) | System and method for voice driven lip syncing and head reenactment | |
CN112992120A (zh) | 语音转换虚拟脸部图像的方法 | |
CN113362432A (zh) | 一种面部动画生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210901 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230502 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231114 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7421869 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |