JP7321464B2 - 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置 - Google Patents

抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置 Download PDF

Info

Publication number
JP7321464B2
JP7321464B2 JP2021067008A JP2021067008A JP7321464B2 JP 7321464 B2 JP7321464 B2 JP 7321464B2 JP 2021067008 A JP2021067008 A JP 2021067008A JP 2021067008 A JP2021067008 A JP 2021067008A JP 7321464 B2 JP7321464 B2 JP 7321464B2
Authority
JP
Japan
Prior art keywords
frame
frames
motion
dimensional model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021067008A
Other languages
English (en)
Other versions
JP2022162268A (ja
Inventor
起揚 銭
Original Assignee
モリカトロン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モリカトロン株式会社 filed Critical モリカトロン株式会社
Priority to JP2021067008A priority Critical patent/JP7321464B2/ja
Publication of JP2022162268A publication Critical patent/JP2022162268A/ja
Application granted granted Critical
Publication of JP7321464B2 publication Critical patent/JP7321464B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Studio Devices (AREA)

Description

特許法第30条第2項適用 (1)ウェブサイトの掲載アドレス https://tech.morikatron.ai/entry/2020/05/13/100000 掲載日 令和2年5月13日 (2)ウェブサイトの掲載アドレス https://tech.morikatron.ai/entry/2020/06/01/100000 掲載日 令和2年5月13日
本開示は、抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置に関する。
一般的に、動画像は、複数の静止画像で構成される。動画像を構成する各静止画像は、フレームと呼ばれる。複数のフレームに、あるオブジェクトの一連の動きが描かれている場合、複数のフレームを時間の経過に伴って切り替えることで、動画像は、オブジェクトの動きを表現することができる。
種々の目的で、動画像を構成する複数のフレームのうちの一部を間引いて新たな動画像を生成することが行われている。特許文献1には、仮想空間上に表現された3Dアニメーションのデータ容量を削減するため、一部のフレームを間引く技術が開示されている。特許文献1に開示された技術では、対象のフレームを直前のキーフレームと比較して、アニメーションデータのボーンの速度値が所定値以上変化した場合にそのフレームがキーフレームとして設定され、その速度値が所定値以上変化していない場合にそのフレームが間引かれる。
特開2019-102025号公報
3Dアニメーションでは、オブジェクトの滑らかな動きを表現することができる。このような3Dアニメーションにおいて、2Dアニメーションのように、メリハリのある動きを表現したいという要望がある。しかしながら、特許文献1に開示された技術は、オブジェクトにメリハリのある動きを与えるために開発されたものではなく、このような要望に十分に応えることができるものではない。
本開示は、3Dアニメーションをメリハリのある2Dアニメーション風に変換することができる抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置を提供することを目的とする。
本開示の抽出プログラムは、コンピュータに、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、を実行させ、前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
本開示の抽出プログラムは、コンピュータに、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、を実行させる。
本開示の画像生成プログラムは、上記した抽出プログラムにより抽出された前記特徴フレームに基づいて、動画像を生成する手順を前記コンピュータに実行させる。
本開示の抽出方法は、コンピュータが、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、を実行し、前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
本開示の抽出方法は、コンピュータが、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、を実行する。
本開示の画像生成方法は、上記した抽出方法により抽出された前記特徴フレームに基づいて、動画像を生成する。
本開示の抽出装置は、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する抽出部と、を備え、前記抽出部は、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する。
本開示の抽出装置は、複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する抽出部と、を備える。
本開示の画像生成装置は、上記した抽出装置により抽出された前記特徴フレームに基づいて、動画像を生成する画像生成部を備える。
本開示によれば、3Dアニメーションをメリハリのある2Dアニメーション風に変換することができる。
画像生成装置の構成について説明するための図 特徴フレームについて説明するための図 特徴フレームについて説明するための図 画像生成装置の動作について説明するための図 図3のステップS2における特徴フレームの抽出処理の詳細を示す図 補間処理について説明するための図 補間処理について説明するための図 補間処理について説明するための図 評価値算出処理について説明するための図 評価値算出処理について説明するための図
以下、本開示の各実施の形態について図面を参照して詳細に説明する。ただし、必要以上に詳細な説明、例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明等は省略する場合がある。また、以下の説明および参照される図面は、当業者が本開示を理解するために提供されるものであって、本開示の請求の範囲を限定するためのものではない。
<発明に至る経緯>
3次元モデル(以下、3Dモデルと記載する)を用いたアニメーション(以下、3Dアニメーションと記載する)が普及している。3Dアニメーションは、例えば、現実の人物や物体の動きをデジタルに記録してその動きの通りに3Dモデルを動かしたり、特定のフレーム(キーフレーム)における3Dモデルの位置や形状を指定してキーフレーム間を補間したりすることで生成される。
一方、2次元平面上に描かれた絵を用いたアニメーション(以下、2Dアニメーションと記載する)も普及している。2Dアニメーションは、例えば、互いに異なる複数枚の絵を、時間の経過に伴って切り替えることで生成される。
一般的な2Dアニメーションは、所定時間内に複数枚の絵、例えば1秒間に24枚の絵が、次々と切り替えられることで生成されている。これらの複数枚の絵は、描かれたオブジェクトの動きを表すため、僅かに異なる箇所が存在する。これらの複数枚の絵は全て異なっていてもよいが、あえて全く同じ絵を連続して用いることで動きにメリハリを付けることができる。このような手法は、コマ打ち等と呼ばれる。複数の絵が全て異なる場合、1コマ打ちと呼ばれ、全く同じ絵が2コマ連続して用いられる場合は2コマ打ち、3コマ連続して用いられる場合は3コマ打ちと呼ばれる。作品全体で同じコマ数のコマ打ちが用いられてもよいし、場面に合わせて異なるコマ数のコマ打ちが用いられることもある。
ところで、近年では2Dアニメーション作品が製作される際に、コスト低減や表現力向上のため、3Dモデルが利用される場合がある。例えば2Dアニメーションで複数のキャラクターのダンスシーンを表現しようとした場合、それぞれのコマ(フレーム)における複数のキャラクターのポーズを1つ1つ描くには多大な労力とコストが掛かる。一方、キャラクター毎に3Dモデルを作成しておけば、複数のキャラクターの3Dモデルにそれぞれ指定した動きをさせ、指定した視点からこれらのキャラクターを見た場合の3Dアニメーションを作成することで、比較的容易にダンスシーンを表現することができる。このため、例えば複数のオブジェクトが同じような動きをする場面では、あらかじめ3Dアニメーションを作成し、これをもとに2Dアニメーションを作成する手法が有効である。
3Dアニメーションは、一般的に、2Dアニメーションと比較して、動きにメリハリはないが、なめらかな動きを表現する(「ぬるぬる動く」等と形容される)ように製作されることが多い。
滑らかな動きを表現する3Dアニメーションを元に、動きにメリハリがある2Dアニメーションを製作したいという要望がある。この要望に応える手法として、3Dアニメーションを構成するフレームのうち、3Dモデルの特徴的な動きを表現するフレームのみを抽出してつなげる手法がある。
例えば人間が各フレームにおける3Dモデルの動きを見ながら、特徴的な動きを表現するフレームを抽出する場合、多大な労力と時間とが掛かってしまう。このため、特徴的な動きを表現するフレームを抽出する工程を自動化することが要望されている。
自動化の手法の1つの例として、3Dアニメーションが有するフレームから時間的に均一にフレームを抽出する方法がある。しかしながら、均一にフレーム抽出を行った場合、抽出されたフレームをつなげたアニメーションは、メリハリがなく、のっぺりとした動きに見えてしまう可能性が高いだけでなく、特徴的な動きを表現する特定のフレームが含まれない場合があるため、違和感がある動きに見えてしまう可能性がある。
このような事情に鑑み、以下では、3Dモデルを含む動画像から特徴的な動きを表現するフレームを自動的に抽出し、つなげることで、視覚的に違和感がなく、かつ動きにメリハリがある動画像を生成することができる画像生成装置1について詳細に説明する。
<構成>
図1は、本開示の実施の形態に係る画像生成装置1の構成について説明するための図である。
図1に示すように、画像生成装置1は、操作部11と、表示部12と、記憶部13と、通信部14と、制御部2と、を備える。制御部2は、取得部21と、抽出部22と、補間部23と、差分算出部24と、画像生成部25と、を備えている。画像生成装置1は、例えばパーソナルコンピュータ(PC)、ワークステーション、タブレット端末等のコンピュータである。なお、画像生成装置1は、本開示の画像生成装置の一例であり、その一部が、本開示の抽出装置の一例である。
操作部11は、キーボード、マウス等の入力デバイスである。なお、操作部11は、表示部12に設けられたタッチパネルで構成されてもよい。
表示部12は、液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示デバイスである。
記憶部13は、画像生成装置1が行う各種処理に必要な情報や、画像生成装置1が生成した情報や、画像生成装置1の外部から取得した情報等を記憶する記憶デバイスである。記憶部13は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等で構成される。
通信部14は、有線通信または無線通信により画像生成装置1の外部と通信を行う通信デバイスである。
制御部2は、例えばCPU(Central Proccessing Unit)で構成されており、画像生成装置1の各種処理の制御を行う。
取得部21は、例えば通信部14を介して、画像生成装置1の外部から処理対象の第1の動画像を取得する。画像生成装置1の外部とは、例えば3Dアニメーションを生成する他のコンピュータである。本実施の形態において、第1の動画像には、少なくとも1つのオブジェクトが含まれている。なお、本実施の形態では、画像生成装置1に第1の動画像が入力され、画像生成装置1は入力された動画像に基づいて新たな動画像(後述する第2の動画像)を生成する例について説明するが、本開示はこれに限定されない。画像生成装置1には、オブジェクトを含む第1の動画像の代わりに、例えば所定の座標系における、フレーム毎のオブジェクトの座標値が入力されてもよい。または、画像生成装置1には、オブジェクトの位置、速度、各部位が画面において占める領域等、オブジェクトの動きを示す各種のパラメータが入力されてもよい。第1の動画像、所定の座標系における、フレーム毎のオブジェクトの座標値、オブジェクトの位置、速度、各部位が画面において占める領域等、オブジェクトの動きを示す各種のパラメータは、本開示の動きデータの一例である。
抽出部22は、複数フレームのそれぞれにおけるオブジェクトの動きを評価する評価値(後述の情報量損失を評価する評価値)に基づいて、オブジェクトの動きを特徴づける特徴フレームを抽出する。本実施の形態において、オブジェクトとは、3Dアニメーションに含まれる3Dモデルである。
図2Aおよび図2Bは、特徴フレームについて説明するための図である。図2Aは、第1の動画像に含まれるフレーム毎のオブジェクトの軌跡を示したものである。図2Aでは、1フレーム目(frame 1)から9フレーム目(frame 9)までのオブジェクトの位置がそれぞれ示されている。
図2Aに示す例では、1フレーム目から9フレーム目にかけて、オブジェクトは山なりの軌跡を描いて移動している。頂点付近(4フレーム目から6フレーム目)では移動速度が遅くなっており、オブジェクトのフレーム間の移動距離が比較的短いが、オブジェクトが下方に進む(6フレーム目から9フレーム目)につれて移動速度が速く、フレーム間の移動距離が比較的長くなっている。
図2Bは、図2Aに示す複数のフレームから抽出部22が抽出した特徴フレームの例を示す図である。図2Bに示す例では、1フレーム目、4フレーム目、6フレーム目、および9フレーム目が特徴フレームとして抽出されている。
図2Bにおいて特徴フレームとして抽出されているフレームは、オブジェクトの動きを効果的に表現することができるフレームである。1フレーム目は、オブジェクトの動きの始点を表すフレームである。9フレーム目は、オブジェクトの動きの終点を表すフレームである。図2Aに示すように、オブジェクトは、1フレーム目から4フレーム目まで比較的速く、4フレーム目から6フレーム目まで比較的遅く、6フレーム目から9フレーム目まではさらに速く移動している。このため、図2Bに示す例では、速度が大きく変化する4フレーム目と6フレーム目が残りの特徴フレームとして抽出されている。
そのため、図2Bにおいて抽出されている特徴フレームのみを用いて新たに動画像を生成した場合、新たに生成された動画像におけるオブジェクトの動きは、人の目に違和感なく映るだけでなく、メリハリのある動きに見えることが期待される。
なお、図2Aおよび図2Bに示す例では、第1の動画像に登場する1つのオブジェクトについて示した。しかしながら、第1の動画像に複数のオブジェクトが登場する場合、抽出部22は、複数のオブジェクト全て、または画像生成装置1の使用者によって選択されたいずれかのオブジェクト全ての動きを特徴づけるように、特徴フレームを抽出すればよい。抽出部22が特徴フレームを抽出する抽出処理の詳細については、後述する。
補間部23は、第1の動画像を構成する複数のフレームのうち、いずれか特定のフレームが間引かれたと仮定した場合に、特定のフレームに含まれるオブジェクトの動きを、特定のフレームの前後の少なくともいずれかに基づいて補間する。なお、オブジェクトの動きとは、オブジェクトに含まれる点または領域の、複数のフレームに亘る位置、速度、面積変化、または形状の変化を意味する。また、特定のフレームは1フレームには限られず、2以上のフレームであってもよい。補間部23が、特定フレームにおけるオブジェクトの動きを補間する補間処理の詳細については、後述する。
差分算出部24は、間引かれると仮定した特定のフレームにおけるオブジェクトの動きと、補間部23が生成した補間フレームにおける同じオブジェクトの動きとの差分に関する評価値を算出する。この評価値は、特定のフレームを間引いた時の情報量損失を評価するものである。オブジェクトの動きの差分とは、オブジェクトに含まれる点または領域毎の、補間フレームと特定のフレームとの間の位置、速度、面積変化のいずれかの差分である。差分算出部24が評価値を算出する評価値算出処理の詳細については、後述する。
画像生成部25は、抽出部22が抽出した特徴フレームに基づいて、第2の動画像を生成する。第2の動画像のフレームレートは、例えば24fpsである。
<動作>
次に、画像生成装置1の動作について説明する。図3は、画像生成装置1の動作について説明するための図である。
図3に示すように、取得部21は、通信部14を介して、画像生成装置1の外部から第1の動画像を取得する(ステップS1)。抽出部22は、第1の動画像を構成する複数のフレームの中から、特徴フレームを抽出する(ステップS2)。画像生成部25は、特徴フレームに基づいて、第2の動画像を生成する(ステップS3)。
図4は、図3のステップS2における特徴フレームの抽出処理の詳細を示す図である。抽出処理において、まず、補間部23は、特定のフレームに含まれるオブジェクトの動きを、特定のフレームの前後の少なくともいずれかに基づいて補間する補間処理を行う(ステップS11)。
次に、差分算出部24は、あるフレームが間引かれた場合のオブジェクトの動きと、補間部23が生成した補間フレームを考慮した場合のオブジェクトの動きとの差分に関する評価値を算出する評価値算出処理を行う(ステップS12)。評価値算出処理の詳細については、後述する。上述したように、オブジェクトの動きの差分とは、オブジェクトに含まれる点または領域毎の、補間フレームと特定のフレームとの間の位置、速度、加速度、面積変化のいずれかの差分である。
そして、抽出部22は、評価値に基づき、特徴フレームを抽出する(ステップS13)。
[補間処理]
図5A、図5B、および図6は、補間処理について説明するための図である。図5Aは、第1の動画像に含まれるオブジェクトの一例として、各フレームにおけるキャラクターの関節点を示している。図5Bは、図5Aに示す複数の関節点のうち、一例として左足に相当する関節点の動きを示している。言い換えると、図5Bは、複数のフレームにおいて関節点が移動する軌跡を示している。
図5Bには、5つのフレームにおける関節点J1~J5が示されている。関節点J1~J5は、同じ関節点であるが、フレームが進むにつれオブジェクトが動いているため、フレーム毎に異なる位置にある。関節点J1の位置は、1フレーム目における関節点の位置である。関節点J2の位置は、2フレーム目における関節点の位置である。関節点J3の位置は、3フレーム目における関節点の位置である。関節点J4の位置は、4フレーム目における関節点の位置である。関節点J5の位置は、5フレーム目における関節点の位置である。
図5Bにおいて、これらの5フレームのうち、2フレーム目と4フレーム目が間引かれると仮定する。この場合、間引かれた結果残るフレームは、1フレーム目、3フレーム目、および5フレーム目である。補間部23は、間引かれたと仮定された2フレーム目および4フレーム目における関節点の位置を、その前後のいずれかのフレームにおける関節点の位置に基づいて推定する。
図5Bに破線で示す関節点JB2、JB4の位置は、補間部23により補間されている。図5Bに示す例では、補間部23は、前後のフレームの関節点を用いて線形補間によって補間された関節点(前後のフレームの関節点を結ぶ線分の中点)の位置を決定している。すなわち、補間された関節点JB2は、関節点J1とJ3とを結ぶ線上に、関節点JB4は、関節点J3とJ5とを結ぶ線上にある。
図5Aおよび図5Bでは、オブジェクトの関節点の位置を補間する例について説明した。図6では、オブジェクトの一部を構成する領域の位置を補間する例について説明する。図6に示される領域は、例えばキャラクターがそれぞれ異なる複数の色の領域によって構成されている場合における、1つの色の領域である。
図6には、2つのフレームにおける領域A1、A3が示されている。図6における領域A1、A3の位置は、同じ領域の異なるフレームにおける位置に対応する。
図6では、領域A1に対応するフレームを1フレーム目、領域A3に対応するフレームを3フレーム目として、2フレーム目が間引かれたと仮定したときの、間引かれる前の2フレーム目における領域の位置をオプティカルフロー(変位ベクトル)を用いて推定する様子を示している。図6における矢印は、各領域の一部の画素におけるオプティカルフローを例示している。実際には、領域に含まれる全ての画素についてオプティカルフローが計算される。領域A1からA3への変位に関するオプティカルフローは、例えば既存のオプティカルフロー予測AI等を用いて算出されればよい。
図6に破線で示す領域AB2の位置は、1フレーム目から3フレーム目への領域のオプティカルフローに基づいて、2フレーム目が間引かれたと仮定した場合の領域の位置に対応する。領域AB2の位置は、1フレーム目から3フレーム目への領域のオプティカルフローの中間位置に設定される。これにより、2フレーム目が間引かれた場合の、2フレーム目における領域の位置を補間することができる。
なお、補間部23による補間の方法はオプティカルフローを用いた方法には限定されず、例えば各フレームにおける領域の位置矢速度を用いた線形補間、または多項式補間が採用されてもよい。また、図5A,図5B,および図6に示す例では、2次元平面上での動きの補間を行っていたが、入力される第1の動画像が3Dアニメーションである場合は、3次元空間内での動きの補間を行い、その後にレンダリングして2次元平面上での関節点または領域の位置や速度を導出してもよい。
補間部23は、上述した補間処理を、第1の動画像に含まれる全てのオブジェクト、または、画像生成装置1の使用者が指定したオブジェクト(1または複数)に対して行う。
[評価値算出処理]
図7Aおよび図7Bは、評価値算出処理について説明するための図である。図7Aは関節点同士の速度に関する評価値を算出する様子を示しており、図7Bは領域同士のオプティカルフローに関する評価値を算出する様子を示している。
図7Aには、5つのフレームにおける関節点J6~J10が示されている。また、図7Aには、2フレーム目から4フレーム目が間引かれたと仮定した場合の、補間部23によって補間された関節点JB7,JB8,JB9が示されている。図7Aの各関節点から延びる矢印は、各関節点の速度ベクトル、すなわち各関節点の速度の向きと大きさを示している。
図7Aに一例を示すように、差分算出部24は、フレーム毎に、間引かれていない場合の各関節点の速度vTi=(vxti,yti)と、7フレーム目から9フレーム目が間引かれたと仮定した場合の各関節点の速度v=(vxi,yi)との差分εi=(vxi―xti,yi―yti)を関節点毎に算出する。iはフレームの順番に対応する。そして、差分算出部24は、処理対象のフレームに含まれるオブジェクトの全ての関節点における速度の平均二乗誤差MSEを以下の式により評価値として算出する。なお、間引かれたと仮定したフレーム以外のフレーム(図7Aの例では、6フレーム目、および10フレーム目)についても差分を算出する理由は、図7Aの関節点J6における速度ベクトルを示す矢印のように、後のフレームが間引かれたか否かで速度ベクトルが変化するからである。
Figure 0007321464000001
一方、図7Bには、1フレーム目における領域A4、および、3フレーム目における領域A6が示されている。また、図7Bには、2フレーム目が間引かれたと仮定した場合の、補間部23によって補間された領域AB5が示されている。
このような場合、差分算出部24は、処理対象のフレームに含まれるオブジェクトにおける領域の全ての画素におけるオプティカルフローの平均値に基づいて、上記の式により平均二乗誤差MSEを評価値として算出する。オプティカルフローは変位ベクトルであるため、領域内の全画素の平均値を上記の式の速度vTi=(vxti,yti)に代入すればよい。
なお、上述の説明では、差分算出部24は、フレーム毎に、当該フレームが間引かれていない場合と間引かれたと仮定した場合とについて、オブジェクトの関節点の速度、または領域の全画素におけるオプティカルフローの平均の差分を算出している。しかしながら、本開示はこれには限定されず、例えば差分算出部24は、オブジェクトを構成する画素毎に、速度または位置の差分を算出してもよい。また、差分算出部24は、オブジェクトの画素、関節点、または領域の速度または位置だけでなく、例えば加速度、面積変化または形状の変化についての差分を算出してもよい。
また、差分算出部24は、オプティカルフローを用いて回転ベクトルを算出し、回転ベクトルの差分と算出するようにしてもよい。さらに、差分算出部24は、領域におけるオプティカルフローの平均の差分とともに、当該領域の面積の差分を算出するようにしてもよい。この際、アースムーバー距離(Earth Mover's Distance)を用いて領域間の形状を考慮した位置差分を算出するようにしてもよい。
また、上述の説明では、単に全ての関節点または全ての領域の平均二乗誤差を評価値とする例について説明した。ここで、関節点または領域ごとに重み付けを行い、平均二乗誤差を算出するようにしてもよい。重み付けの例としては、関節点または領域の面積の大きさやコントラスト等に基づいて行うようにすればよい。
また、上述の説明では、差分算出部24は、平均二乗誤差を評価値として算出していたが、他の誤差計算方法を採用してもよい。
[特徴フレームの抽出]
抽出部22は、差分算出部24が算出した評価値に基づき、第1の動画像を構成する複数のフレームの中から、画像生成装置1の使用者が指定したフレーム数だけ、オブジェクトの動きを特徴づける特徴フレームを抽出する。
具体的には、抽出部22は、第1の動画像がN枚のフレームで構成されており、使用者がここからn枚のフレームを抽出すると指定した場合、N枚のうちどのn枚を抽出したときに残りの(N-n)枚のフレーム分の評価値が最小となるか、という組み合わせ最適化問題を解くことにより、特徴フレームを抽出する。
抽出部22が組み合わせ最適化問題を解く手法として、例えば焼きなまし法(シミュレーテッド・アニーリング法)や、累積和法等が挙げられる。
焼きなまし法は、値が小さくなる方向へ解の探索を進めていくアルゴリズムにおいて、大きな値から小さな値へ次第に変化する温度変数を導入し、温度変数の大きさに応じて値が大きくなる方向へも探索を進めることで、大域的最適解に辿り着くことを可能とするアルゴリズムである。
累積和法とは、対象のフレームまでの、オブジェクトの評価値を計算して加算し、加算した評価値が所定のしきい値を超えているか否かによって近似解を求める手法である。すなわち、累積和法では、最初のフレームから対象のフレームまでの、オブジェクトの全ての関節点または全ての領域の評価値を加算し、加算した評価値が所定のしきい値を超えている場合にその対象フレームの1つ前のフレームを特徴フレームに決定する。それ以降は、特徴フレームの次のフレームを対象フレームとし、0から新たに評価値の加算を行う。なお、0から新たに加算を行うのではなく、累積和と閾値との差分値を初期値として、次フレームの評価値を新たに加算するようにしてもよい。所定のしきい値は、抽出される特徴フレームの数が、画像生成装置1の使用者が指定した数となるように設定されればよい。
焼きなまし法を採用した場合、時間はかかるが必ず最適解を得られるという利点がある。一方、累積和法を採用した場合、計算時間は早いが、得られる結果が最適解ではなく、近似解である。したがって、求められる第2の動画像の品質によって、焼きなまし法と累積和法のいずれを採用するかが選択可能であってもよい。また、焼きなまし法と累積和法とを併用することにより、処理時間と品質とのバランスを制御できるようにしてもよい。具体的には、累積和法で得られた結果に対して焼きなまし法を行うことで、結果の最適性を向上させるような手法が考えられる。
以上のようにして、抽出部22は、画像生成装置1の使用者が指定した数の特徴フレームを抽出する。このようにして抽出した特徴フレームは、図2Bに示したように、3Dモデルのメリハリのある動きを表現できるフレームである。
なお、抽出部22が特徴フレームを抽出する方法については、上述した方法に限定されない。例えば、人工知能(Artificial Intelligence:AI)を用いて、どのようなフレームが特徴フレームにふさわしいかを学習させることにより、特徴フレームを抽出するようにしてもよい。この場合、補間部23による、間引かれると仮定したフレームにおけるオブジェクトの動きの補間や、差分算出部24による評価値の算出は必要ない。具体的には、複数の動画像と、各動画像から抽出された特徴フレームとを教師データとして学習を行わせることにより、新たに入力した第1の動画像から特徴フレームを抽出するAIを作成してもよい。なお、別途評価値を算出し、算出した評価値をAIの報酬信号に用いることにより、学習を行うようにしてもよい。
また、間引かれると仮定したフレームにおけるオブジェクトの動きの補間や、差分算出部24による評価値の算出を行わずに、累積和法を用いて特徴フレームの抽出を行うことも可能である。例えば、オプティカルフロー等を用いてフレーム毎の動きの変化量(加速度等)を算出し、その変化量をフレーム毎に加算して、各フレームの重要性を量的に評価することで、特徴フレームを抽出し、特徴フレーム以外のフレームを間引くようにしてもよい。
以上、本発明に係る実施の形態について図面を参照して詳述してきたが、上述した画像生成装置1の各機能は、コンピュータプログラムにより実現され得る。
画像生成装置1の各機能を実現するコンピュータは、キーボードやマウス、タッチパッド等の入力装置、ディスプレイやスピーカ等の出力装置、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク装置やSSD(Solid State Drive)等の記憶装置、DVD-ROM(Digital Versatile Disk Read Only Memory)やUSB(Universal Serial Bus)メモリ等の記録媒体から情報を読み取る読取装置、ネットワークを介して通信を行うネットワークカード等を備え、各部はバスにより接続される。
そして、読取装置は、上記各装置の機能を実現するためのプログラムを記録した記録媒
体からそのプログラムを読み取り、記憶装置に記憶させる。あるいは、ネットワークカードが、ネットワークに接続されたサーバ装置と通信を行い、サーバ装置からダウンロードした上記各装置の機能を実現するためのプログラムを記憶装置に記憶させる。
そして、CPUが、記憶装置に記憶されたプログラムをRAMにコピーし、そのプログラムに含まれる命令をRAMから順次読み出して実行することにより、上記各装置の機能が実現される。
<作用、効果>
本開示の画像生成装置によれば、複数フレームで構成されており、所定の三次元モデルの動きを表す3Dアニメーションに基づいて、複数フレームのそれぞれにおける三次元モデルの動きを評価する評価値を算出し、動きを特徴付ける特徴フレームを抽出し、特徴フレームを用いて3Dアニメーションの一部のフレームを間引いて第2の動画像を生成する。
すなわち、本開示の画像生成装置では、第2の動画像を、オブジェクトの動きを特徴づける特徴フレームを用いて構成するため、動きにメリハリがある、2Dアニメーション風の動画像とすることができる。
本開示は、動画像を生成することができる画像生成装置に有用である。
1 画像生成装置
11 操作部
12 表示部
13 記憶部
14 通信部
2 制御部
21 取得部
22 抽出部
23 補間部
24 差分算出部
25 画像生成部

Claims (17)

  1. コンピュータに、
    複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
    前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、
    を実行させ
    前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
    抽出プログラム。
  2. 前記複数フレームのうち、いずれか特定のフレームが間引かれたと仮定した場合に、前記特定のフレームに含まれる前記三次元モデルの動きを、前記特定のフレームの前後の少なくともいずれかに基づいて補間する手順と、
    前記特定のフレームにおける前記三次元モデルの動きと、補間された前記三次元モデルの動きとの差分に関する前記評価値を算出する手順と、
    をさらに実行させる、
    請求項1に記載の抽出プログラム。
  3. 前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる特定の点または領域毎に、線形補間または多項式補間を行うことにより、間引かれた前記特定のフレームにおける前記三次元モデルの動きを補間する、
    請求項に記載の抽出プログラム。
  4. 前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる特定の領域毎に算出したオプティカルフローを用いて、間引かれた前記特定のフレームにおける前記三次元モデルの動きを補間する、
    請求項に記載の抽出プログラム。
  5. 前記三次元モデルの動きを補間する手順において、前記三次元モデルに含まれる同色の領域を、前記特定の領域とする、
    請求項またはに記載の抽出プログラム。
  6. 前記評価値を算出する手順において、前記三次元モデルの動きと、補間された前記三次元モデルの動きとの差分の平均二乗誤差を前記評価値として算出する、
    請求項からのいずれか一項に記載の抽出プログラム。
  7. 前記評価値を算出する手順において、前記三次元モデルと、補間された前記三次元モデルとの位置、速度、または面積変化について前記差分の前記平均二乗誤差を算出する、
    請求項に記載の抽出プログラム。
  8. 前記特徴フレームを抽出する手順において、焼きなまし法を用いて、前記評価値が最小となる前記組み合わせを決定する、
    請求項からのいずれか一項に記載の抽出プログラム。
  9. 前記特徴フレームを抽出する手順において、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから前記特定のフレームまでの間で、フレーム間の前記評価値を累積し、累積した前記評価値が閾値を超えたフレームまたはその1つ前のフレームを前記特徴フレームとする、
    請求項からのいずれか一項に記載の抽出プログラム。
  10. コンピュータに、
    複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
    前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、
    を実行させる、抽出プログラム。
  11. 請求項1から1のいずれか一項に記載の抽出プログラムにより抽出された前記特徴フレームに基づいて、動画像を生成する手順を前記コンピュータに実行させる、
    画像生成プログラム。
  12. コンピュータが、
    複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
    前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する手順と、
    を実行し、
    前記特徴フレームを抽出する手順において、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
    抽出方法。
  13. コンピュータが、
    複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する手順と、
    前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を累積し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する手順と、
    を実行する、抽出方法。
  14. 請求項12または13に記載の抽出方法により抽出された前記特徴フレームに基づいて、動画像を生成する、
    画像生成方法。
  15. 複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、
    前記フレーム毎の前記動きデータに基づいて、前記複数フレームのそれぞれにおいて補間された前記三次元モデルの動きを評価する評価値に基づいて、前記動きを特徴付ける特徴フレームを抽出する抽出部と、
    を備え
    前記抽出部は、前記複数フレームのうち所定数のフレームが間引かれる場合に、前記評価値が最小となるように間引かれるフレームの組み合わせを決定し、前記組み合わせに含まれるフレーム以外のフレームを前記特徴フレームとして抽出する、
    抽出装置。
  16. 複数フレームで構成されており、所定の三次元モデルの動きに関する動きデータを取得する取得部と、
    前記フレーム毎の前記動きデータに基づいて、前記三次元モデルに含まれる特定の点または領域毎に、前記複数フレームにおける最初のフレームから特定のフレームまでの間で、フレーム間の前記動きの変化量を加算し、累積した前記変化量が閾値を超えたフレームまたはその1つ前のフレームを、前記動きを特徴付ける特徴フレームとして抽出する抽出部と、
    を備える、抽出装置。
  17. 請求項15または16に記載の抽出装置により抽出された前記特徴フレームに基づいて、動画像を生成する画像生成部を備える、
    画像生成装置。
JP2021067008A 2021-04-12 2021-04-12 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置 Active JP7321464B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021067008A JP7321464B2 (ja) 2021-04-12 2021-04-12 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021067008A JP7321464B2 (ja) 2021-04-12 2021-04-12 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置

Publications (2)

Publication Number Publication Date
JP2022162268A JP2022162268A (ja) 2022-10-24
JP7321464B2 true JP7321464B2 (ja) 2023-08-07

Family

ID=83720995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021067008A Active JP7321464B2 (ja) 2021-04-12 2021-04-12 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置

Country Status (1)

Country Link
JP (1) JP7321464B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007069350A1 (ja) 2005-12-12 2007-06-21 Monolith Co., Ltd. 画像符号化および復号の方法と装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3727768B2 (ja) * 1997-10-15 2005-12-14 株式会社ハドソン コンピュータ画像の表示方法及び表示装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007069350A1 (ja) 2005-12-12 2007-06-21 Monolith Co., Ltd. 画像符号化および復号の方法と装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
坂東 幸浩 他,高フレームレート映像信号に対するフレームレートダウンサンプリング方法の検討,映像情報メディア学会技術報告,日本,(社)映像情報メディア学会,2009年02月04日,Vol.33 No.6,pp.13-17

Also Published As

Publication number Publication date
JP2022162268A (ja) 2022-10-24

Similar Documents

Publication Publication Date Title
US11170558B2 (en) Automatic rigging of three dimensional characters for animation
US11017586B2 (en) 3D motion effect from a 2D image
JP7147078B2 (ja) ビデオフレームの情報ラベリング方法、装置、機器及びコンピュータプログラム
Chai et al. Vision-based control of 3 D facial animation
JP7026222B2 (ja) 画像生成ネットワークの訓練および画像処理方法、装置、電子機器、ならびに媒体
CN110533752B (zh) 一种人体动作编辑模型的生成方法、存储介质及电子设备
JP4966431B2 (ja) 画像処理装置
US11398059B2 (en) Processing 3D video content
US11758082B2 (en) System for automatic video reframing
US20230123820A1 (en) Generating animated digital videos utilizing a character animation neural network informed by pose and motion embeddings
JP4668360B2 (ja) 移動体検出方法及び移動体検出装置
KR101148101B1 (ko) 얼굴 표정 리타게팅 방법
US11282257B2 (en) Pose selection and animation of characters using video data and training techniques
KR20140024058A (ko) 이미지 모델 구축 방법 및 장치
CN110910479B (zh) 视频处理方法、装置、电子设备及可读存储介质
WO2017094527A1 (ja) 動画生成システムおよび動画表示システム
CN114339409A (zh) 视频处理方法、装置、计算机设备及存储介质
JP5893166B2 (ja) 3dモデル・モーフィングのための方法および装置
CN113039561A (zh) 通过生成数据项的编码表示来对齐序列
CN108271022A (zh) 一种运动估计的方法及装置
JP7321464B2 (ja) 抽出プログラム、画像生成プログラム、抽出方法、画像生成方法、抽出装置、および画像生成装置
WO2021187093A1 (ja) 画像処理装置、および、動画像データ生成方法
US11151767B1 (en) Techniques for removing and synthesizing secondary dynamics in facial performance capture
CN115023742A (zh) 具有详细褶皱的面部网格变形
CN117241065B (zh) 视频插帧图像生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20210421

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221019

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230718

R150 Certificate of patent or registration of utility model

Ref document number: 7321464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150