JP2022530935A - インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 - Google Patents
インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 Download PDFInfo
- Publication number
- JP2022530935A JP2022530935A JP2021549562A JP2021549562A JP2022530935A JP 2022530935 A JP2022530935 A JP 2022530935A JP 2021549562 A JP2021549562 A JP 2021549562A JP 2021549562 A JP2021549562 A JP 2021549562A JP 2022530935 A JP2022530935 A JP 2022530935A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- sequence
- interactive object
- feature code
- interactive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 193
- 238000000034 method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims description 82
- 238000013528 artificial neural network Methods 0.000 claims description 30
- 230000000306 recurrent effect Effects 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 8
- 230000033001 locomotion Effects 0.000 description 22
- 230000009471 action Effects 0.000 description 11
- 230000008921 facial expression Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
<関連出願の相互引用>
本発明は、出願番号が2020102458024であり、出願日が2020年3月31日である中国特許出願の優先権を主張し、当該中国特許出願の全ての内容が援用により本願に組み入れられる。
Claims (20)
- インタラクティブ対象の駆動方法であって、
テキストデータに対応する音素シーケンスを取得することと、
前記音素シーケンスにマッチングするインタラクティブ対象の少なくとも1つの局部領域の制御パラメータ値を取得することと、
取得した前記制御パラメータ値に基づいて前記インタラクティブ対象の姿態を制御することと、を含む
ことを特徴とするインタラクティブ対象の駆動方法。 - 前記テキストデータに基づいて前記インタラクティブ対象を展示する表示デバイスがテキストを展示するように制御すること、および/または、前記テキストデータに対応する音素シーケンスに基づいて前記表示デバイスが音声を出力するように制御することを、さらに含む
ことを特徴とする請求項1に記載のインタラクティブ対象の駆動方法。 - 前記インタラクティブ対象の局部領域の制御パラメータは、前記局部領域の姿態制御ベクトルを含み、
前記音素シーケンスにマッチングするインタラクティブ対象の少なくとも1つの局部領域の制御パラメータ値を取得することは、
前記音素シーケンスに対して特徴エンコーディングを実行して、前記音素シーケンスに対応する第1コードシーケンスを得ることと、
前記第1コードシーケンスに基づいて少なくとも1つの音素に対応する特徴コードを取得することと、
前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の姿態制御ベクトルを取得することと、を含む
ことを特徴とする請求項1または2に記載のインタラクティブ対象の駆動方法。 - 前記音素シーケンスに対して特徴エンコーディングを実行して、前記音素シーケンスに対応する第1コードシーケンスを得ることは、
前記音素シーケンスに含まれている複数種類の音素の中の各々の音素に対して、前記音素に対応するサブコードシーケンスを生成することと、
前記複数種類の音素にそれぞれ対応するサブコードシーケンスに基づいて、前記音素シーケンスに対応する第1コードシーケンスを得ることと、を含む
ことを特徴とする請求項3に記載のインタラクティブ対象の駆動方法。 - 前記音素シーケンスに含まれている複数種類の音素の中の各々の音素に対して、前記音素に対応するサブコードシーケンスを生成することは、
各時点に前記音素が対応されているか否かを検出することと、
前記音素が対応されている時点のコード値を第1数値として設定し、前記音素が対応されていない時点のコード値を第2数値として設定することによって、前記音素に対応する前記サブコードシーケンスを得ることと、を含む
ことを特徴とする請求項4に記載のインタラクティブ対象の駆動方法。 - 前記複数種類の音素の中の各々の音素に対応する前記サブコードシーケンスに対して、ガウスフィルターを利用して前記音素の時間における連続値に対してガウス畳み込み操作を実行することをさらに含む
ことを特徴とする請求項5に記載のインタラクティブ対象の駆動方法。 - 前記第1コードシーケンスに基づいて少なくとも1つの音素に対応する特徴コードを取得することは、
所定の長さの時間ウィンドウおよび所定のステップサイズで、前記第1コードシーケンスに対してウィンドウスライディングを実行し、前記時間ウィンドウ内の特徴コードを対応する前記少なくとも1つの音素の特徴コードとして設定し、前記ウィンドウスライディングを実行して得られた複数の前記特徴コードに基づいて、第2コードシーケンスを得ることを含み、
取得した前記制御パラメータ値に基づいて前記インタラクティブ対象の姿態を制御することは、
前記第2コードシーケンスに対応する姿態制御ベクトルのシーケンスを取得することと、
前記姿態制御ベクトルのシーケンスに基づいて前記インタラクティブ対象の姿態を制御することと、を含む
ことを特徴とする請求項3から6のいずれか1項に記載のインタラクティブ対象の駆動方法。 - 前記音素シーケンス中の前記音素間の時間間隔が所定の閾値よりも大きい場合、前記局部領域の所定の制御パラメータ値に基づいて、前記インタラクティブ対象の姿態を制御することをさらに含む
ことを特徴とする請求項1から7のいずれか1項に記載のインタラクティブ対象の駆動方法。 - 前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の姿態制御ベクトルを取得することは、
前記特徴コードを事前に訓練されたリカレントニューラルネットワークに入力して、前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の前記姿態制御ベクトルを得ることを含む
ことを特徴とする請求項3に記載のインタラクティブ対象の駆動方法。 - 前記リカレントニューラルネットワークは、特徴コードサンプルを利用して訓練して得られたものであり、
前記インタラクティブ対象の駆動方法は、
キャラクターが発した音声のビデオセグメントを取得し、前記ビデオセグメントに基づいて前記キャラクターが含まれた複数の第1画像フレームを取得することと、
前記ビデオセグメント中から該当する音声セグメントを抽出し、前記音声セグメントに基づいてサンプル音素シーケンスを取得し、前記サンプル音素シーケンスに対して特徴エンコーディングを実行することと、
前記第1画像フレームに対応する少なくとも1つの音素の特徴コードを取得することと、
前記第1画像フレームを前記インタラクティブ対象が含まれた第2画像フレームに変換し、前記第2画像フレームに対応する少なくとも1つの局部領域の姿態制御ベクトル値を取得することと、
前記姿態制御ベクトル値に基づいて、前記第1画像フレームに対応する前記特徴コードをレーベリングして、前記特徴コードサンプルを得ることと、をさらに含む
ことを特徴とする請求項9に記載のインタラクティブ対象の駆動方法。 - 前記特徴コードサンプルに基づいて初期リカレントニューラルネットワークを訓練し、ネットワーク損失の変化が収束条件を満たす後に、前記リカレントニューラルネットワークを訓練して得ることをさらに含み、
ここで、前記ネットワーク損失は、前記リカレントニューラルネットワークが予測して得た前記少なくとも1つの局部領域の前記姿態制御ベクトル値と、レーベリングした前記姿態制御ベクトル値と、の間の差異を含む
ことを特徴とする請求項10に記載のインタラクティブ対象の駆動方法。 - インタラクティブ対象の駆動装置であって、
テキストデータに対応する音素シーケンスを取得するための第1取得ユニットと、
前記音素シーケンスにマッチングするインタラクティブ対象の少なくとも1つの局部領域の制御パラメータ値を取得するための第2取得ユニットと、
取得した前記制御パラメータ値に基づいて前記インタラクティブ対象の姿態を制御するための駆動ユニットと、を備える
ことを特徴とするインタラクティブ対象の駆動装置。 - 前記テキストデータに基づいて前記インタラクティブ対象を展示する表示デバイスがテキストを展示するように制御し、および/または、前記テキストデータに対応する音素シーケンスに基づいて前記表示デバイスが音声を出力するように制御するための出力ユニットを、さらに備える
ことを特徴とする請求項12に記載のインタラクティブ対象の駆動装置。 - 前記第2取得ユニットは、
前記音素シーケンスに対して特徴コードを実行して、前記音素シーケンスに対応する第1コードシーケンスを得、
前記第1コードシーケンスに基づいて少なくとも1つの音素に対応する特徴コードを取得し、
前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の姿態制御ベクトルを取得し、
ここで、前記音素シーケンスに対して特徴コードを実行して、前記音素シーケンスに対応する第1コードシーケンスを得ることは、
前記音素シーケンスに含まれている複数種類の音素の中の各々の音素に対して、前記音素に対応するサブコードシーケンスを生成することと、
前記複数種類の音素にそれぞれ対応するサブコードシーケンスに基づいて、前記音素シーケンスに対応する第1コードシーケンスを得ることと、を含む
ことを特徴とする請求項12または13に記載のインタラクティブ対象の駆動装置。 - 前記第1コードシーケンスに基づいて少なくとも1つの音素に対応する特徴コードを取得するときに、
前記第2取得ユニットは、
所定の長さの時間ウィンドウおよび所定のステップサイズで、前記コードシーケンスに対してウィンドウスライディングを実行し、前記時間ウィンドウ内の特徴コードを対応する前記少なくとも1つの音素の特徴コードとして設定し、前記ウィンドウスライディングを実行して得られた複数の特徴コードに基づいて、第2コードシーケンスを得、
前記駆動ユニットは、
前記第2コードシーケンスに対応する姿態制御ベクトルのシーケンスを取得し、
前記姿態制御ベクトルのシーケンスに基づいて前記インタラクティブ対象の姿態を制御する
ことを特徴とする請求項14に記載のインタラクティブ対象の駆動装置。 - 前記音素シーケンス中の前記音素間の時間間隔が所定の閾値よりも大きい場合、前記局部領域の所定の制御パラメータ値に基づいて、前記インタラクティブ対象の姿態を制御するための停頓駆動ユニットをさらに備える
ことを特徴とする請求項12から15のいずれか1項に記載のインタラクティブ対象の駆動装置。 - 前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の姿態制御ベクトルを取得するときに、
前記第2取得ユニットは、前記特徴コードを事前に訓練されたリカレントニューラルネットワークに入力して、前記特徴コードに対応する前記インタラクティブ対象の少なくとも1つの局部領域の前記姿態制御ベクトルを得る
ことを特徴とする請求項14に記載のインタラクティブ対象の駆動装置。 - サンプル取得ユニットをさらに備え、
当該サンプル取得ユニットは、
キャラクターが発した音声のビデオセグメントを取得し、前記ビデオセグメントに基づいて前記キャラクターが含まれた複数の第1画像フレームを取得し、
前記ビデオセグメント中から該当する音声セグメントを抽出し、前記音声セグメントに基づいてサンプル音素シーケンスを取得し、前記サンプル音素シーケンスに対して特徴コードを実行し、
前記第1画像フレームに対応する少なくとも1つの音素の特徴コードを取得し、
前記第1画像フレームを前記インタラクティブ対象が含まれた第2画像フレームに変換し、前記第2画像フレームに対応する少なくとも1つの局部領域の姿態制御ベクトル値を取得し、
前記姿態制御ベクトル値に基づいて、前記第1画像フレームに対応する前記特徴コードをレーベリングして、前記特徴コードサンプルを得る
前記インタラクティブ対象の駆動装置は、前記特徴コードサンプルに基づいて初期リカレントニューラルネットワークを訓練し、ネットワーク損失の変化が収束条件を満たす後に、前記リカレントニューラルネットワークを訓練して得るための訓練ユニットをさらに備え、
ここで、前記ネットワーク損失は、前記リカレントニューラルネットワークが予測して得た前記少なくとも1つの局部領域の前記姿態制御ベクトル値と、レーベリングした前記姿態制御ベクトル値と、の間の差異を含む
ことを特徴とする請求項17に記載のインタラクティブ対象の駆動装置。 - 電子デバイスであって、
メモリとプロセッサとを備え、
前記メモリは、プロセッサ上で運行可能なコンピュータ命令を記憶し、
前記プロセッサは、前記コンピュータ命令が実行されるときに、請求項1から11のいずれか1項に記載の方法を実行する
ことを特徴とする電子デバイス。 - コンピュータプログラムが記憶されているコンピュータ可読記録媒体であって、
前記コンピュータプログラムがプロセッサによって実行されるときに、請求項1から11中のいずれか1項に記載の方法が実現される
ことを特徴とするコンピュータ可読記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010245802.4A CN111460785B (zh) | 2020-03-31 | 2020-03-31 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN202010245802.4 | 2020-03-31 | ||
PCT/CN2020/129793 WO2021196644A1 (zh) | 2020-03-31 | 2020-11-18 | 交互对象的驱动方法、装置、设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022530935A true JP2022530935A (ja) | 2022-07-05 |
Family
ID=71683475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021549562A Pending JP2022530935A (ja) | 2020-03-31 | 2020-11-18 | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 |
Country Status (6)
Country | Link |
---|---|
JP (1) | JP2022530935A (ja) |
KR (1) | KR20210124307A (ja) |
CN (1) | CN111460785B (ja) |
SG (1) | SG11202111909QA (ja) |
TW (1) | TW202138992A (ja) |
WO (1) | WO2021196644A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460785B (zh) * | 2020-03-31 | 2023-02-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN111459450A (zh) * | 2020-03-31 | 2020-07-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN115409920A (zh) * | 2022-08-30 | 2022-11-29 | 重庆爱车天下科技有限公司 | 一种虚拟对象唇形驱动系统 |
KR102601159B1 (ko) * | 2022-09-30 | 2023-11-13 | 주식회사 아리아스튜디오 | 버추얼 휴먼 인터렉션 생성 장치 및 그에 대한 방법 |
CN115662388A (zh) * | 2022-10-27 | 2023-01-31 | 维沃移动通信有限公司 | 虚拟形象面部驱动方法、装置、电子设备及介质 |
CN116524896A (zh) * | 2023-04-24 | 2023-08-01 | 北京邮电大学 | 一种基于发音生理建模的发音反演方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058908A (ja) * | 2001-08-10 | 2003-02-28 | Minolta Co Ltd | 顔画像制御方法および装置、コンピュータプログラム、および記録媒体 |
JP2015038725A (ja) * | 2013-07-18 | 2015-02-26 | 国立大学法人北陸先端科学技術大学院大学 | 発話アニメーション生成装置、方法、及びプログラム |
JP2015148932A (ja) * | 2014-02-06 | 2015-08-20 | Psソリューションズ株式会社 | 音声同期処理装置、音声同期処理プログラム、音声同期処理方法及び音声同期システム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609969B (zh) * | 2012-02-17 | 2013-08-07 | 上海交通大学 | 基于汉语文本驱动的人脸语音同步动画的处理方法 |
JP2015166890A (ja) * | 2014-03-03 | 2015-09-24 | ソニー株式会社 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
CN106056989B (zh) * | 2016-06-23 | 2018-10-16 | 广东小天才科技有限公司 | 一种语言学习方法及装置、终端设备 |
CN107704169B (zh) * | 2017-09-26 | 2020-11-17 | 北京光年无限科技有限公司 | 虚拟人的状态管理方法和系统 |
CN107891626A (zh) * | 2017-11-07 | 2018-04-10 | 嘉善中奥复合材料有限公司 | 电玉粉压片成型系统 |
CN110876024B (zh) * | 2018-08-31 | 2021-02-12 | 百度在线网络技术(北京)有限公司 | 确定虚拟形象唇部动作的方法和装置 |
CN109377540B (zh) * | 2018-09-30 | 2023-12-19 | 网易(杭州)网络有限公司 | 面部动画的合成方法、装置、存储介质、处理器及终端 |
CN110136698B (zh) * | 2019-04-11 | 2021-09-24 | 北京百度网讯科技有限公司 | 用于确定嘴型的方法、装置、设备和存储介质 |
CN110176284A (zh) * | 2019-05-21 | 2019-08-27 | 杭州师范大学 | 一种基于虚拟现实的言语失用症康复训练方法 |
CN111145322B (zh) * | 2019-12-26 | 2024-01-19 | 上海浦东发展银行股份有限公司 | 用于驱动虚拟形象的方法、设备和计算机可读存储介质 |
CN111460785B (zh) * | 2020-03-31 | 2023-02-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN111459452B (zh) * | 2020-03-31 | 2023-07-18 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN111459454B (zh) * | 2020-03-31 | 2021-08-20 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
CN111459450A (zh) * | 2020-03-31 | 2020-07-28 | 北京市商汤科技开发有限公司 | 交互对象的驱动方法、装置、设备以及存储介质 |
-
2020
- 2020-03-31 CN CN202010245802.4A patent/CN111460785B/zh active Active
- 2020-11-18 JP JP2021549562A patent/JP2022530935A/ja active Pending
- 2020-11-18 KR KR1020217027692A patent/KR20210124307A/ko not_active Application Discontinuation
- 2020-11-18 SG SG11202111909QA patent/SG11202111909QA/en unknown
- 2020-11-18 WO PCT/CN2020/129793 patent/WO2021196644A1/zh active Application Filing
- 2020-12-16 TW TW109144447A patent/TW202138992A/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058908A (ja) * | 2001-08-10 | 2003-02-28 | Minolta Co Ltd | 顔画像制御方法および装置、コンピュータプログラム、および記録媒体 |
JP2015038725A (ja) * | 2013-07-18 | 2015-02-26 | 国立大学法人北陸先端科学技術大学院大学 | 発話アニメーション生成装置、方法、及びプログラム |
JP2015148932A (ja) * | 2014-02-06 | 2015-08-20 | Psソリューションズ株式会社 | 音声同期処理装置、音声同期処理プログラム、音声同期処理方法及び音声同期システム |
Non-Patent Citations (1)
Title |
---|
櫻井 隆平: "RNNを用いた音声特徴のみからの表情付きトーキングヘッド自動生成", 第22回 画像センシングシンポジウム SSII2016 [USB] THE 22ND SYMPOSIUM ON SENSING VI, JPN6022041201, 11 July 2016 (2016-07-11), JP, ISSN: 0005047103 * |
Also Published As
Publication number | Publication date |
---|---|
SG11202111909QA (en) | 2021-11-29 |
TW202138992A (zh) | 2021-10-16 |
WO2021196644A1 (zh) | 2021-10-07 |
CN111460785B (zh) | 2023-02-28 |
CN111460785A (zh) | 2020-07-28 |
KR20210124307A (ko) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022531057A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 | |
JP2022530935A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 | |
WO2021169431A1 (zh) | 交互方法、装置、电子设备以及存储介质 | |
JP2022531072A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記憶媒体 | |
WO2021196646A1 (zh) | 交互对象的驱动方法、装置、设备以及存储介质 | |
US20230082830A1 (en) | Method and apparatus for driving digital human, and electronic device | |
CN112528936B (zh) | 视频序列编排方法、装置、电子设备及存储介质 | |
CN112673400A (zh) | 化身动画 | |
WO2022252890A1 (zh) | 交互对象驱动和音素处理方法、装置、设备以及存储介质 | |
KR20230075998A (ko) | 텍스트 기반 아바타 생성 방법 및 시스템 | |
JP2022531056A (ja) | インタラクティブ対象の駆動方法、装置、デバイス、及び記録媒体 | |
CN115376487A (zh) | 数字人的控制方法、模型训练方法和装置 | |
KR100965622B1 (ko) | 감성형 캐릭터 및 애니메이션 생성 방법 및 장치 | |
Gjaci | Comunicazione Non Verbale Culturalmente Competente Basata Su Generative Adversarial Networks | |
JP2023026448A (ja) | コミュニケーション支援プログラム、コミュニケーション支援方法、コミュニケーション支援システム、端末装置及び非言語表現プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220930 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230426 |