JP2023026531A

JP2023026531A - バーチャルキャラクター生成方法、装置、電子機器、記憶媒体及びコンピュータプログラム

Info

Publication number: JP2023026531A
Application number: JP2022211477A
Authority: JP
Inventors: 傑李; Jie Li; 晨趙; Toki Cho
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-03-11
Filing date: 2022-12-28
Publication date: 2023-02-24
Also published as: US20230206578A1; CN114612600A; CN114612600B; KR20220161233A

Abstract

【課題】本開示は、バーチャルキャラクター生成方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供し、人工知能技術分野に関し、特に、コンピュータビジョン、バーチャル・拡張現実、メタバースの技術分野に関する。
【解決手段】前記方法の具体的な解決手段は、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得して、複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成して、第１の３次元バーチャルキャラクターの検知特徴を特定して、前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する。
【選択図】図２

Description

本開示は、人工知能技術分野に関し、特に、コンピュータビジョン、バーチャル・拡張現実及びメタバース等の技術分野に関し、画像処理のシーンに適用される。具体的に、バーチャルキャラクター生成方法、装置、電子機器、記憶媒体及びコンピュータプログラムに関する。

バーチャルキャラクターは、メタバース、ソーシャル、生中継、ゲームなどのシーンに広く適用されている。バーチャルキャラクターは、人工の方式で生成されることが可能である。

本開示は、バーチャルキャラクター生成方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。

本開示の一態様によれば、バーチャルキャラクター生成方法を提供し、該バーチャルキャラクター生成方法は、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得することと、前記複数の周波数領域点データを調整し、複数の調整された点データを取得することと、前記複数の調整された点データをレンダリングし、第１の３次元バーチャルキャラクターを生成することと、前記第１の３次元バーチャルキャラクターの検知特徴を特定することと、前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成することとを含む。

本開示の別の一態様によれば、バーチャルキャラクター生成装置を提供し、該バーチャルキャラクター生成装置は、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する変換モジュールと、前記複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成するレンダリングモジュールと、前記第１の３次元バーチャルキャラクターの検知特徴を特定する第１の特定モジュールと、前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する生成モジュールとを含む。

本開示の別の一態様によれば、電子機器を提供し、該電子機器は、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサに通信接続されたメモリと備え、前記メモリには、前記少なくとも１つのプロセッサにより実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが上記の方法を実行することができるように、前記少なくとも１つのプロセッサにより実行される。

本開示の別の一態様によれば、コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体を提供し、前記コンピュータ命令が前記コンピュータに上記の方法を実行させる。

本開示の別の一態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサにより実行される時に上記の方法を実現する。

理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。

ここで、図面は、本開示の発明をよりよく理解するために用いられ、本開示を限定するものではない。

図１は、本開示の一実施例に係るバーチャルキャラクター生成方法及び装置を適用できる例示的なシステムアーキテクチャの模式図である。図２は、本開示の一実施例に係るバーチャルキャラクター生成方法のフローチャートである。図３は、本開示の一実施例に係るバーチャルキャラクター生成方法のフローチャートである。図４は、本開示の一実施例に係るバーチャルキャラクター生成方法のフローチャートである。図５は、本開示の一実施例に係るバーチャルキャラクター生成装置のブロック図である。図６は、本開示の一実施例に係るバーチャルキャラクター生成方法を適用できる電子機器のブロック図である。

以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分かるべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。

バーチャルキャラクターは、バーチャルの胴体を含んでもよい。１つのバーチャルキャラクターに対して、人工の方式に基づいて設計、生成及び最適化してもよく、高い時間コストの必要となる。さらに、人工の方式に基づいて生成されたバーチャルキャラクターは、スタイルが比較的に単一となる。

図１は、本開示の一実施例に係るバーチャルキャラクター生成方法及び装置を適用できる例示的なシステムアーキテクチャの模式図である。留意されるべきこととして、図１に示すのは、本開示の実施例のシステムアーキテクチャを適用できる例示に過ぎず、当業者が本開示の技術内容を理解することに役立つが、本開示の実施例は、別の装置、システム、環境又はシーンに適用できないことを意味するものではない。

図１に示すように、該実施例に係るシステムアーキテクチャ１００は、端末装置１０１、１０２、１０３と、ネットワーク１０４と、サーバ１０５とを含んでもよい。ネットワーク１０４は、端末装置１０１、１０２、１０３とサーバ１０５との間に通信リンクの媒体を提供する。ネットワーク１０４は、例えば、有線及び／又は無線通信リンクなどの様々な接続タイプを含んでもよい。

ユーザは、端末装置１０１、１０２、１０３を使用して、ネットワーク１０４を介してサーバ１０５と対話することにより、メッセージ等を受信又は送信してもよい。端末装置１０１、１０２、１０３は、表示スクリーンを備え、ウェブブラウシングをサポートする様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ及びデスクトップコンピュータなどを含むが、それらに限定されない。

サーバ１０５は、様々なサービスを提供する様々なタイプのサーバであってもよく、例えば、ユーザが端末装置１０１、１０２、１０３を用いてブラウシングされたサイトをサポートするバックグラウンド管理サーバ（例に過ぎない）である。バックグラウンド管理サーバは、受信されたユーザ要求等のデータを解析等の処理を行い、処理結果（例えば、ユーザの要求に応じて取得又は生成されたウェブページ、情報、又はデータ等）を端末装置にフィードバックしてもよい。

説明すべきこととして、本開示の実施例が提供するバーチャルキャラクター生成方法は、一般的に、サーバ１０５により実行されてもよい。それに対して、本開示の実施例が提供するバーチャルキャラクター生成装置は、一般的に、サーバ１０５に設置されてもよい。本開示の実施例が提供するバーチャルキャラクター生成方法は、サーバ１０５と異なり、端末装置１０１、１０２、１０３及び／又はサーバ１０５と通信可能なサーバ又はサーバクラスタにより実行されてもよい。それに対して、本開示の実施例が提供するバーチャルキャラクター生成装置は、サーバ１０５と異なり、端末装置１０１、１０２、１０３及び／又はサーバ１０５と通信可能なサーバ又はサーバクラスタに設置されてもよい。

図２は、本開示の一実施例に係るバーチャルキャラクター生成方法を模式的に示すフローチャートである。

図２に示すように、該方法２００は、操作Ｓ２１０～Ｓ２４０を含む。

操作Ｓ２１０において、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する。

例えば、初期３次元バーチャルキャラクターは、１つの所定の３次元バーチャルキャラクターであってもよい。

例えば、初期３次元バーチャルキャラクターにおける複数の点データをフーリエ変換することによって、複数の点データを周波数領域に変換してもよい。

操作Ｓ２２０において、複数の周波数領域点データをレンダリングして、第１の３次元バーチャルキャラクターを生成する。

例えば、各種のレンダラーを用いて、複数の周波数領域点データをレンダリングしてもよい。一例において、ＰＹＴＯＲＣＨ３Ｄレンダラーを用いて、複数の周波数領域点データをレンダリングしてもよい。

操作Ｓ２３０において、第１の３次元バーチャルキャラクターの検知特徴を特定する。
例えば、各種の特徴抽出モデルに基づいて、第１の３次元バーチャルキャラクターの検知特徴を特定してもよい。

操作Ｓ２４０において、検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する。

例えば、各種の特徴抽出モデルを用いて、取得されたスタイル記述情報を特徴抽出して所定のスタイル特徴を取得してもよい。

例えば、各種の損失関数を用いて、検知特徴と所定のスタイル特徴との差分値を特定してもよい。一例において、Ｌ２損失関数を用いて、検知特徴と所定のスタイル特徴との差分値を特定してもよい。該差分値が所定の条件を満たす場合、上記の前記第１の３次元バーチャルキャラクターを第２の３次元バーチャルキャラクターとしてもよい。該差分値が所定の条件を満たさない場合、検知特徴と所定のスタイル特徴との差分値が所定の条件を満たすまでに、上記の前記第１の３次元バーチャルキャラクターを調整してもよい。例えば、所定の条件は、該差分値が所定の閾値よりも小さいことであってもよい。

本開示の実施例によれば、所定のスタイル特徴とマッチングする１つの３次元バーチャルキャラクターを生成してもよい。

幾つかの実施例において、対照的言語画像事前学習（ＣＬＩＰ）モデルを用いて、第１の３次元バーチャルキャラクターを処理し、第１の３次元バーチャルキャラクターの検知特徴を取得してもよい。

例えば、対照的言語画像事前学習（ＣｏｎｔｒａｓｔｉｖｅＬａｎｇｕａｇｅ－ＩｍａｇｅＰｒｅ－ｔｒａｉｎｉｎｇ，ＣＬＩＰ）モデルを用いて、テキストの特徴を抽出してもよく、画像の特徴を抽出してもよい。ＣＬＩＰモデルは、オーペンソースの汎用モデルであり、即ちテキストと画像とを連結する。ＣＬＩＰモデルが完成する必要なタスクは、画像における各種の視覚情報を認識し、該情報を膨大なピクチャーのうちの１つに関連付けることである。

一例において、第１の３次元バーチャルキャラクターを表示しているスクリーンにおいて、スクリーンショットの操作を実行し、１つのスクリーンショット画像を取得してもよい。ＣＬＩＰモデルを用いて該スクリーンショット画像を処理して、検知特徴を取得する。

幾つかの実施例において、ＣＬＩＰモデルを用いて、スタイル記述情報に基づいて所定のスタイル特徴を特定する。

例えば、ターゲット対象から入力された１つのテキストを取得し、該テキストを１つのスタイル記述情報としてもよい。次に、上記のＣＬＩＰモデルを用いて、該スタイル記述情報を処理して、所定のスタイル特徴を特定してもよい。一例において、スタイル記述情報は、例えば「可愛い」、「クール」などのキーワードを含むテキストであってもよい。ＣＬＩＰモデルは、画像とテキストがマッチングしているかどうかを効率よく特定してもよい。また、所定のスタイル特徴及び検知特徴は、同一のＣＬＩＰモデルで特定されてもよく、両者の差分が調整された後、両者がよりマッチングできており、それにより、スタイル記述情報に対してより適した３次元バーチャルキャラクターを生成する。

幾つかの実施例において、各種の３Ｄツールを用いて複数の周波数領域点データに基づいて処理するように、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換する。例えば、３Ｄツールは、Ｕｎｉｔｙ３Ｄツールであってもよい。

幾つかの実施例において、上記の所定の条件は、差分値が収束することであってもよい。

図３は、本開示の別の一実施例に係るバーチャルキャラクター生成方法を模式的に示すフローチャートである。

図３に示すように、該方法３００は、操作Ｓ３１０～操作Ｓ３３０、及び操作Ｓ３４１～操作Ｓ３４４を含んでもよい。

操作Ｓ３１０において、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する。

例えば、操作Ｓ３１０は、上記の操作Ｓ２１０と同様又は類似であり、ここで、本開示は贅言を要しない。

操作Ｓ３２０において、複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成する。

例えば、操作Ｓ３２０は、上記の操作Ｓ２２０と同様又は類似であり、ここで、本開示は贅言を要しない。

操作Ｓ３３０において、第１の３次元バーチャルキャラクターの検知特徴を特定する。

例えば、上記のＣＬＩＰモデルを用いて、第１の３次元バーチャルキャラクターの検知特徴を特定してもよい。

操作Ｓ３４１において、検知特徴と所定のスタイル特徴との差分値を特定する。

例えば、所定のスタイル特徴は、上記のＣＬＩＰモデルを用いてスタイル記述情報に基づいて特定される。

例えば、Ｌ２損失関数を用いて、検知特徴と所定のスタイル特徴との差分値を特定してもよい。Ｌ２損失関数は、最小二乗法（ＬｅａｓｔＳｑｕａｒｅＥｒｒｏｒ，ＬＳＥ）損失関数とも称される。

操作Ｓ３４２において、差分値が収束するかどうかを特定する。

本開示の実施例において、差分値が収束すると特定された場合、操作Ｓ３４３を実行する。

例えば、ｎ個目の差分値が所定の差分閾値以下と特定された後、ｎ個目の差分値の後のｉ個の差分値がいずれも所定の差分閾値以下とさらに特定された場合、差分値が収束すると特定されてもよい。一例において、ｎが１以上の整数であり、ｉが１以上の整数である。例えば、ｉは、所定の値であり、ｉ＝１。

本開示の実施例において、差分値が収束しないと特定された場合、操作Ｓ３４４を実行し、操作Ｓ３２０に戻る。

例えば、ｍ個目の差分値が所定の差分閾値以下と特定された後、ｍ個目の差分値の後のｊ個の差分値のうちのいずれか１つの差分値が所定の差分閾値よりも大きいとさらに特定された場合、差分値が収束しないと特定され、操作Ｓ３４４を実行する。操作Ｓ３４４を実行した後、操作Ｓ３２０に戻してもよい。一例において、ｍが１以上の整数であり、ｊが１以上の整数である。例えば、ｊは、所定の値であり、ｊ＝１。

操作Ｓ３４３において、現在の第１の３次元バーチャルキャラクターを第２の３次元バーチャルキャラクターとする。

例えば、上記のように、差分値が収束すると特定された後、ｎ個目の差分値に対応する第１の３次元バーチャルキャラクターＶｉｒ＿ｎを第２の３次元バーチャルキャラクターとしてもよい。

操作Ｓ３４４において、複数の周波数領域点データを調整する。

例えば、上記のように、差分値が収束しないと特定された後、ｍ＋ｊ個目の差分値に対応する複数の周波数領域点データを調整して、複数の調整された周波数領域点データを取得する。複数の調整された周波数領域点データに基づいて、操作Ｓ３２０に戻り、複数の調整された周波数領域点データをレンダリングし、ｍ＋ｊ＋１個目の第１の３次元バーチャルキャラクターを生成する。後続の操作をさらに実行する。

例えば、点データは、点座標データと色データとを含む。一例において、周波数領域点データは、周波数領域点座標データと周波数領域点色データとを含む。

本開示の実施例によれば、差分値が収束しない場合、差分値が収束するまでに周波数領域点データを調整し、それにより、第２の３次元バーチャルキャラクターの検知特徴を予定のスタイル特徴とマッチングさせて、ユーザの体験を向上する。

幾つかの実施例において、方法３００との相違は、差分値と予定の差分閾値とを比較して、差分値が収束するか否かを特定することにある。

例えば、ｎ個目の差分値が所定の差分閾値以上の場合、差分値が収束すると特定する。

また、例えば、ｎ個目の差分値が所定の差分閾値よりも大きい場合、差分値が収束しないと特定する。

図４は、本開示の他の実施例に係るバーチャルキャラクター生成方法のフローチャートである。

図４に示すように、該方法４４４は、複数の周波数領域点データを調整してもよく、以下、操作Ｓ４４４１～操作Ｓ４４４２を参照して詳しく説明する。

操作Ｓ４４４１において、複数の周波数領域点データのうちの各周波数領域点データに対して、各周波数領域点データの点法線を特定する。

例えば、Ｕｎｉｔｙ３Ｄツールを用いて、複数の周波数領域点データに基づいて、１つのメッシュ（Ｍｅｓｈ）モデルＭｏｄｅｌ＿Ｍｅｓｈ＿Ｋを特定する。該メッシュモデルＭｏｄｅｌ＿Ｍｅｓｈ＿Ｋには、複数の三角形平面タイルサブモデルを含む。一例において、１つの三角形平面タイルサブモデルは、１つの周波数領域点データに対応してもよい。一例において、メッシュモデルＭｏｄｅｌ＿Ｍｅｓｈ＿Ｋに基づいてレンダリングし、１つの３次元バーチャルキャラクターを取得してもよい。

操作Ｓ４４４２において、点法線の伸びる方向に沿って各周波数領域点データを調整する。

例えば、上記のように、周波数領域点データは、周波数領域点座標データと周波数領域点色データとを含む。点法線の伸びる方向に沿って周波数領域点座標データの数値を調整してもよい。

例えば、点法線の伸びる方向に沿って周波数領域点座標データの数値を調整した後、１つの調整されたメッシュモデルＭｏｄｅｌ＿Ｍｅｓｈ＿Ｋ＋１を取得してもよい。Ｋは１以上の整数である。

一例において、レンダラーを用いて、メッシュモデルＭｏｄｅｌ＿Ｍｅｓｈ＿Ｋ＋１をレンダリングして、Ｋ＋１回目に調整された第１の３次元バーチャルキャラクターを取得してもよい。点法線の伸びる方向に沿って調整することにより、調整された周波数領域点データ分布がより均一となるように、各周波数領域点が一定の範囲内に移動することを確保できる。

幾つかの実施例において、複数の周波数領域点データを調整することは、各周波数領域点色データの数値を調整することを含んでもよい。

幾つかの実施例において、メッシュモデルのデータ構造は、１つのグラフ構造であってもよい。それに応じて、メッシュモデルは、複数の点と、複数の辺と、複数の面を含んでもよい。

例えば、メッシュモデルのデータ構造は、１つの有向グラフであってよい。また、例えば、メッシュモデルのデータ構造は、１つの無向グラフ構造であってもよい。

幾つかの実施例において、点法線は、頂点法線であってもよい。

例えば、頂点の法線を取得するように、三角形平面タイルの頂点の面領域法線を加重平均してもよい。

幾つかの実施例において、方法４００と異なり、複数の周波数点データを調整することは、複数の周波数点データに基づいて、面の点法線を特定し、面の点法線の伸びる方向に沿って複数の周波数領域点データを調整することを含む。

例えば、１つの面は、少なくとも１つの三角形平面タイルに基づいて特定されてもよい。面の点法線は、メッシュモデルの頂点でなく、面内における頂点を表してもよい。面の点法線とメッシュの頂点との関係は多対一の関係である。例えば、立方体メッシュモデルにおける１つのコーナーポイントについて、該コーナーポイントが３つの垂直の隣接面を有する。面の点法線は、この３つの垂直の隣接面に基づいて特定されてもよい。

図５は、本開示の一実施例に係るバーチャルキャラクター生成装置のブロック図である。

図５に示すように、該装置５００は、変換モジュール５１０と、レンダリングモジュール５２０と、第１の特定モジュール５３０と、生成モジュール５４０とを含んでもよい。

変換モジュール５１０は、初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する。一例において、該変換モジュール５１０は、例えば、図２の操作Ｓ２１０を実行してもよい。

レンダリングモジュール５２０は、前記複数の周波数領域点データをレンダリングして、第１の３次元バーチャルキャラクターを生成する。一例において、該レンダリングモジュール５２０は、例えば、図２の操作Ｓ２２０を実行してもよい。

第１の特定モジュール５３０は、前記第１の３次元バーチャルキャラクターの検知特徴を特定する。一例において、該第１の特定モジュール５３０は、例えば、図２の操作Ｓ２３０を実行してもよい。

生成モジュール５４０は、前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する。一例において、該生成モジュール５４０は、例えば、図２の操作Ｓ２４０を実行してもよい。

幾つかの実施例において、前記生成モジュールは、前記検知特徴と所定のスタイル特徴との差分値を特定する第１の特定サブモジュールと、前記差分値が収束するかどうかを特定する第２の特定サブモジュールと、前記差分値が収束すると特定された場合、現在の第１の３次元バーチャルキャラクターを前記第２の３次元バーチャルキャラクターとする取得サブモジュールと、前記差分値が収束しないと特定された場合、前記複数の周波数領域点データを調整し、前記複数の周波数領域点データをレンダリングする操作へ戻る調整サブモジュールとを含む。

幾つかの実施例において、前記点データは、点座標データと色データとを含む。

幾つかの実施例において、前記調整サブモジュールは、前記複数の周波数領域点データのうちの各周波数領域点データに対して、前記各周波数領域点データの点法線を特定する特定ユニットと、前記点法線の伸びる方向に沿って前記各周波数領域点データを調整する調整ユニットとを含む。

幾つかの実施例において、前記第１の特定モジュールは、ＣＬＩＰモデルを用いて前記第１の３次元バーチャルキャラクターを処理し、前記第１の３次元バーチャルキャラクターの検知特徴を取得することを含む。

幾つかの実施例において、装置５００は、ＣＬＩＰモデルを用いて、スタイル記述情報に基づいて前記所定のスタイル特徴を特定する第２の特定モジュールをさらに含む。

本開示の技術案において、係るユーザ個人情報の収集、記憶、使用、加工、伝送、提供及び開示等の処理は、いずれも関連する法律・法規の規定に適合し、かつ公序良俗に反するものではない。

本開示の実施例は、電子機器、可読記憶媒体及びコンピュータプログラムを提供する。

本開示の実施例によれば、電子機器が提供され、前記電子機器は、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに通信接続されたメモリとを備え、メモリには、少なくとも１つのプロセッサにより実行可能な命令が記憶されており、命令は、少なくとも１つのプロセッサが本開示の提供された方法を実行することができるように、少なくとも１つのプロセッサにより実行される。

例えば、本開示は、コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体を提供し、該コンピュータ命令は、コンピュータに本開示の提供された方法を実行させる。

例えば、本開示は、コンピュータプログラムを提供し、前記コンピュータプログラムは、プロセッサにより実行される場合に、本開示の提供された方法を実現する。以下、図６を参照して詳しく説明する。

図６は、本開示の一実施例に係るバーチャルキャラクター生成方法を適用できる電子機器６００を模式的に示すブロック図である。電子機器は、様々な形態のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータである。電子機器は、さらに様々な形態の移動装置を示してもよく、例えば、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル装置及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、及びそれらの機能は、例示に過ぎず、本明細書に記載された及び／又は要求された本開示の実現を限定しない。

図６に示すように、電子機器６００は、演算ユニット６０１を含み、演算ユニット６０１は、リードオンリーメモリ（ＲＯＭ）６０２に記憶されたコンピュータプログラム又は記憶ユニット６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。ＲＡＭ６０３には、さらに電子機器６００の操作に必要な様々なプログラム及びデータを記憶してもよい。演算ユニット６０１、ＲＯＭ６０２、およびＲＡＭ６０３は、バス６０４を介して相互に接続される。入出力インタフェース６０５も、バス６０４に接続される。

電子機器６００における複数の部品は、Ｉ／Ｏインタフェース６０５に接続され、例えばキーボード、マウス等の入力ユニット６０６と、例えば様々な種類のディスプレイ、スピーカ等の出力ユニット６０７と、例えば磁気ディスク、光ディスク等の記憶ユニット６０８と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信ユニット６０９とを含む。通信ユニット６０９は、電子機器６００がインターネット等のコンピュータネットワーク及び／又は各種の電気通信ネットワークを介して他の機器と情報／データをやり取りすることを可能にする。

演算ユニット６０１は、処理及び演算能力を有する各種の汎用及び／又は専用の処理モジュールであってもよい。演算ユニット６０１の幾つかの例としては、中央処理装置（ＣＰＵ）、ＧＰＵ（ＧＲＡＰＨＩＣＳＰＲＯＣＥＳＳＩＮＧＵＮＩＴ）、各種専用の人工知能（ＡＩ）演算チップ、各種動作機械学習モデルアルゴリズムをランニングする演算ユニット、ＤＳＰ（ＤＩＧＩＴＡＬＳＩＧＮＡＬＰＲＯＣＥＳＳＯＲ）、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、それらに限定されない。演算ユニット６０１は、例えばバーチャルキャラクター生成方法のような上記に記載の各方法及び処理を実行する。例えば、いくつかの実施例において、バーチャルキャラクター生成方法は、例えば記憶ユニット６０８のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ＲＯＭ６０２及び／又は通信ユニット６０９を介して電子機器６００にロード及び／又はインストールされてもよい。コンピュータプログラムがＲＡＭ６０３にロードされて演算ユニット６０１により実行される場合、上記に記載のバーチャルキャラクター生成方法の１つ又は複数の操作を実行してもよい。代替的に、他の実施例において、演算ユニット６０１は、他の任意の適切な方式（例えば、ファームウェアを介する）によりバーチャルキャラクター生成方法を実行するように構成されてもよい。

本明細書で説明したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラムマブルプロセッサを含むプログラムマブルシステムで実行され及び／又は解釈されることが可能であり、該プログラムマブルプロセッサは、専用又は汎用のプログラムマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも１つの入力装置、及び該少なくとも１つの出力装置に伝送することができることを含んでもよい。

本開示の方法を実施するためのプログラムコードは、１つ又は複数の言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラムマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び／又はブロック図に規定された機能／操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。

本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含むか又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は電子機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、１つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、コンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、光記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。

ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、かついかなる形態（音声入力、語音入力又は、触覚入力を含む）でユーザからの入力を受信してもよい。

ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア部品を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド部品を含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる）、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットを例示的に含む。

コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント－サーバの関係を有するコンピュータプログラムによって生成される。

理解されるべきこととして、以上に示した様々な形態のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本発明に記載の各操作は、並列的に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示の発明の所望の結果を実現することができれば、本明細書はここで限定されない。

以上説明したバーチャルキャラクター生成方法、装置、電子機器、記憶媒体およびコンピュータプログラムは、以下のように表現することができる。

第１態様のバーチャルキャラクター生成方法は、
初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得することと、
前記複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成することと、
前記第１の３次元バーチャルキャラクターの検知特徴を特定することと、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成することとを含む。

第２態様のバーチャルキャラクター生成方法は、
第１態様に記載の方法であって、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成することは、
前記検知特徴と所定のスタイル特徴との差分値を特定することと、
前記差分値が収束するかどうかを特定することと、
前記差分値が収束すると特定された場合、現在の第１の３次元バーチャルキャラクターを前記第２の３次元バーチャルキャラクターとすることと、
前記差分値が収束しないと特定された場合、前記複数の周波数領域点データを調整し、前記複数の周波数領域点データをレンダリングする操作へ戻ることとを含む。

第３態様のバーチャルキャラクター生成方法は、
第１又は２態様に記載の方法であって、
前記点データは、点座標データと色データとを含む。

第４態様のバーチャルキャラクター生成方法は、
第３態様に記載の方法であって、
前記複数の周波数領域点データを調整することは、
前記複数の周波数領域点データのうちの各周波数領域点データに対して、
前記各周波数領域点データの点法線を特定することと、
前記点法線の伸びる方向に沿って前記各周波数領域点データを調整することとを含む。

第５態様のバーチャルキャラクター生成方法は、
第２態様に記載の方法であって、
前記第１の３次元バーチャルキャラクターの検知特徴を特定することは、
ＣＬＩＰモデルを用いて前記第１の３次元バーチャルキャラクターを処理し、前記第１の３次元バーチャルキャラクターの検知特徴を取得することを含む。

第６態様のバーチャルキャラクター生成方法は、
第１～５態様のいずれか１つに記載の方法であって、
対照的言語画像事前学習モデル（ＣＬＩＰモデル）を用いて、スタイル記述情報に基づいて前記所定のスタイル特徴を特定することをさらに含む。

第７態様のバーチャルキャラクター生成装置は、
初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する変換モジュールと、
前記複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成するレンダリングモジュールと、
前記第１の３次元バーチャルキャラクターの検知特徴を特定する第１の特定モジュールと、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する生成モジュールとを含む。

第８態様のバーチャルキャラクター生成装置は、
第７態様に記載の装置であって、
前記生成モジュールは、
前記検知特徴と所定のスタイル特徴との差分値を特定する第１の特定サブモジュールと、
前記差分値が収束するかどうかを特定する第２の特定サブモジュールと、
前記差分値が収束すると特定された場合、現在の第１の３次元バーチャルキャラクターを前記第２の３次元バーチャルキャラクターとする取得サブモジュールと、
前記差分値が収束しないと特定された場合、前記複数の周波数領域点データを調整し、前記複数の周波数領域点データをレンダリングする操作へ戻る調整サブモジュールとを含む。

第９態様のバーチャルキャラクター生成装置は、
第７又は８態様に記載の装置であって、
前記点データは、点座標データと色データとを含む。

第１０態様のバーチャルキャラクター生成装置は、
第９態様に記載の装置であって、
前記調整サブモジュールは、
前記複数の周波数領域点データのうちの各周波数領域点データに対して、前記各周波数領域点データの点法線を特定する特定ユニットと、
前記点法線の伸びる方向に沿って前記各周波数領域点データを調整する調整ユニットとを含む。

第１１態様のバーチャルキャラクター生成装置は、
第１０態様に記載の装置であって、
前記第１の特定モジュールは、
ＣＬＩＰモデルを用いて前記第１の３次元バーチャルキャラクターを処理し、前記第１の３次元バーチャルキャラクターの検知特徴を取得することを含む。

第１２態様のバーチャルキャラクター生成装置は、
第７～１１態様のいずれか１つに記載の装置であって、
ＣＬＩＰモデルを用いて、スタイル記述情報に基づいて前記所定のスタイル特徴を特定する第２の特定モジュールをさらに含む。

第１３態様の電子機器は、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信接続されたメモリとを備え、
前記メモリには、前記少なくとも１つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも１つのプロセッサが第１～６態様のいずれか１つに記載の方法を実行することができるように、前記少なくとも１つのプロセッサにより実行される。

第１４態様の記憶媒体は、
コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに第１～６態様のいずれか１つに記載の方法を実行させる記憶媒体である。

第１５態様のコンピュータプログラムは、
プロセッサにより実行される場合に、第１～６態様のいずれか１つに記載の方法を実現するコンピュータプログラムである。

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解されるべきである。本開示の精神と原則内で行われた任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得することと、
前記複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成することと、
前記第１の３次元バーチャルキャラクターの検知特徴を特定することと、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成することとを含むバーチャルキャラクター生成方法。
請求項１に記載の方法であって、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成することは、
前記検知特徴と所定のスタイル特徴との差分値を特定することと、
前記差分値が収束するかどうかを特定することと、
前記差分値が収束すると特定された場合、現在の第１の３次元バーチャルキャラクターを前記第２の３次元バーチャルキャラクターとすることと、
前記差分値が収束しないと特定された場合、前記複数の周波数領域点データを調整し、前記複数の周波数領域点データをレンダリングする操作へ戻ることとを含むバーチャルキャラクター生成方法。
請求項１に記載の方法であって、
前記点データは、点座標データと色データとを含むバーチャルキャラクター生成方法。
請求項３に記載の方法であって、
前記複数の周波数領域点データを調整することは、
前記複数の周波数領域点データのうちの各周波数領域点データに対して、
前記各周波数領域点データの点法線を特定することと、
前記点法線の伸びる方向に沿って前記各周波数領域点データを調整することとを含むバーチャルキャラクター生成方法。
請求項２に記載の方法であって、
前記第１の３次元バーチャルキャラクターの検知特徴を特定することは、
ＣＬＩＰモデルを用いて前記第１の３次元バーチャルキャラクターを処理し、前記第１の３次元バーチャルキャラクターの検知特徴を取得することを含むバーチャルキャラクター生成方法。
請求項１に記載の方法であって、
対照的言語画像事前学習モデル（ＣＬＩＰモデル）を用いて、スタイル記述情報に基づいて前記所定のスタイル特徴を特定することをさらに含むバーチャルキャラクター生成方法。
初期３次元バーチャルキャラクターの複数の点データを周波数領域に変換し、複数の周波数領域点データを取得する変換モジュールと、
前記複数の周波数領域点データをレンダリングし、第１の３次元バーチャルキャラクターを生成するレンダリングモジュールと、
前記第１の３次元バーチャルキャラクターの検知特徴を特定する第１の特定モジュールと、
前記検知特徴と所定のスタイル特徴との差分に基づいて、第２の３次元バーチャルキャラクターを生成する生成モジュールとを含むバーチャルキャラクター生成装置。
請求項７に記載の装置であって、
前記生成モジュールは、
前記検知特徴と所定のスタイル特徴との差分値を特定する第１の特定サブモジュールと、
前記差分値が収束するかどうかを特定する第２の特定サブモジュールと、
前記差分値が収束すると特定された場合、現在の第１の３次元バーチャルキャラクターを前記第２の３次元バーチャルキャラクターとする取得サブモジュールと、
前記差分値が収束しないと特定された場合、前記複数の周波数領域点データを調整し、前記複数の周波数領域点データをレンダリングする操作へ戻る調整サブモジュールとを含むバーチャルキャラクター生成装置。
請求項８に記載の装置であって、
前記点データは、点座標データと色データとを含むバーチャルキャラクター生成装置。
請求項９に記載の装置であって、
前記調整サブモジュールは、
前記複数の周波数領域点データのうちの各周波数領域点データに対して、前記各周波数領域点データの点法線を特定する特定ユニットと、
前記点法線の伸びる方向に沿って前記各周波数領域点データを調整する調整ユニットとを含むバーチャルキャラクター生成装置。
請求項１０に記載の装置であって、
前記第１の特定モジュールは、
ＣＬＩＰモデルを用いて前記第１の３次元バーチャルキャラクターを処理し、前記第１の３次元バーチャルキャラクターの検知特徴を取得することを含むバーチャルキャラクター生成装置。
請求項７～１１のいずれか１項に記載の装置であって、
ＣＬＩＰモデルを用いて、スタイル記述情報に基づいて前記所定のスタイル特徴を特定する第２の特定モジュールをさらに含むバーチャルキャラクター生成装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信接続されたメモリとを備え、
前記メモリには、前記少なくとも１つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも１つのプロセッサが請求項１～６のいずれか１項に記載の方法を実行することができるように、前記少なくとも１つのプロセッサにより実行される電子機器。
コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～６のいずれか１項に記載の方法を実行させる記憶媒体。
プロセッサにより実行される場合に、請求項１～６のいずれか１項に記載の方法を実現するコンピュータプログラム。