JP5372823B2 - Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program - Google Patents
Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program Download PDFInfo
- Publication number
- JP5372823B2 JP5372823B2 JP2010072247A JP2010072247A JP5372823B2 JP 5372823 B2 JP5372823 B2 JP 5372823B2 JP 2010072247 A JP2010072247 A JP 2010072247A JP 2010072247 A JP2010072247 A JP 2010072247A JP 5372823 B2 JP5372823 B2 JP 5372823B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- data
- music
- motion
- video content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
本発明は、映像コンテンツ生成システム、メタデータ構築装置、映像コンテンツ生成装置、携帯端末、映像コンテンツ配信装置及びコンピュータプログラムに関する。 The present invention relates to a video content generation system, a metadata construction device, a video content generation device, a mobile terminal, a video content distribution device, and a computer program.
近年、音楽に合わせてコンピュータ・グラフィックス(CG)オブジェクトを表示させる技術として、例えば、演奏家が音楽を演奏すると、音楽との所定のマッピングのパタンに従って、CGモデルが動くようになる技術が提案されている。 In recent years, as a technique for displaying computer graphics (CG) objects in accordance with music, for example, when a performer plays music, a technique in which a CG model moves according to a predetermined mapping pattern with music has been proposed. Has been.
特許文献1では、CGオブジェクトの時系列に対して、音楽データの静的属性または動的属性をもとにして描画情報(視点情報、光源情報)を再設定する。そして、音楽データをCGオブジェクト表示と同期して再生している。又、特許文献2に記載のモーション作成装置では、複数のモーションにおいて人体姿勢が類似する2つのフレーム間を連結した有向性グラフとしてモーションデータベースを構築し、その複数のモーションの中から、音楽データから取得したビート特徴成分と相関を有する動き特徴成分をもつモーションを選択している。また、非特許文献1に記載の技術では、事前に独自なデータ構造を生成し、音楽を入力すると、Dynamic Programming(動的計画法)でより高速な同期ができる。
In
音楽解析手法としては、非特許文献2に記載の技術が知られている。非特許文献2の技術によれば、発音成分、コードの変化、打楽器の発音時刻などを推定してビート間隔及びビート構造を取得している。動き解析手法としては、非特許文献3に記載の技術が知られている。非特許文献3の技術によれば、動きビートの変化や発生時刻を推定してビート間隔及びビート構造を取得している。
非特許文献4には、モーショングラフ(Motion Graphs)を用いて新たな動きデータを生成する技術が開示されている。
非特許文献5には、パス探索技術として、ある始点からダイナミックプログラミング(dynamic programming)で最適なパスを探索する技術が開示されている。
As a music analysis technique, a technique described in Non-Patent
Non-Patent
Non-Patent
しかし、上述した特許文献1記載の従来技術では、ある楽曲に対してCGアニメーションを作成する際、CGオブジェクトの時系列がその楽曲の音楽の変化にそぐわない場合には、楽曲に合致したCGアニメーションを作成することが難しいという問題がある。又、特許文献2記載の従来技術では、一般に利用可能な膨大な数の動きデータに対して、人体姿勢が類似する2つのフレーム間を連結した有向性グラフとしてモーションデータベースを構築することは、現実的に難しいという問題がある。このため、実際のモーション作成対象の楽曲に基づいて選択された動きデータを対象にして、動きデータ間を連結することが望ましい。
However, in the prior art described in
非特許文献4記載の従来技術では、モーショングラフの構築と最適なパスの探索に要する計算量が膨大である。また、元々のモーション構造を考慮しないで構築されたモーショングラフを使用すると、元々のモーション構造が壊れる可能性がある。例えば、激しい動きとゆっくりの動き間で遷移すると、動きの突然の変化のために、不自然な動き又は不一致な動きが生まれる可能性がある。
In the prior art described in
非特許文献1記載の従来技術では、曲の開始から終了までの音楽データが入力されていなければ、音楽データとCGオブジェクトとを同期させることができないという問題がある。そのため、例えばストリーミング配信される曲に合致したCGアニメーションをリアルタイムに生成することは困難である。
In the prior art described in Non-Patent
本発明は、このような事情を考慮してなされたもので、その目的は、映像コンテンツを同期させる楽曲の開始から終了までの音楽データが入力されていなくても、大規模な動きデータベースを利用して楽曲に合わせた映像コンテンツを生成することができる映像コンテンツ生成システム、メタデータ構築装置、映像コンテンツ生成装置、携帯端末、映像コンテンツ配信装置及びコンピュータプログラムを提供することにある。 The present invention has been made in consideration of such circumstances, and its purpose is to use a large-scale motion database even if music data from the start to the end of the music to be synchronized with the video content is not input. Thus, an object of the present invention is to provide a video content generation system, a metadata construction device, a video content generation device, a mobile terminal, a video content distribution device, and a computer program that can generate video content that matches music.
本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量に基づいて、ノード、エッジおよびエッジの重みを含むモーショングラフを構築するモーショングラフ構築部と、前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、を備え、前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索することを特徴とする映像コンテンツ生成システムである。 The present invention provides a motion graph construction unit that constructs a motion graph including nodes, edges, and edge weights based on feature amounts extracted from motion capture data applicable to video content, and music in each node of the motion graph. A metadata construction unit that calculates metadata indicating the possibility of synchronization with the music content, and music data of the music for which video content generation is to be performed are input in a predetermined amount in order of reproduction, and a music feature amount is acquired from the input music data of the predetermined amount And a node having a certain synchronization possibility in the node group having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data on the motion graph. An optimal path search unit that searches for paths that can be connected to each other, and the path searched by the optimal path search unit A synchronization unit that generates synchronization information that associates the motion data with the predetermined amount of music data, and a video data generation unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information And the metadata constructing unit includes a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to the video content, and an edge indicating connectivity of the node. For each node included in the motion graph to be calculated, the weight calculation means for calculating the weight according to the number of nodes that can be connected after the node, the optimum path search unit is calculated by the weight calculation means a video content generation system comprising that you search the path based on the weights.
また、本発明の映像コンテンツ生成システムにおいて、前記ウェート算出手段は、前記ノードの後に連結することができるノード数がゼロになるノードと、前記ノードの後に連結することができるノード数が無限大になるノードとを算出し、上記二種のノードから他のノードのウェートを推定することを特徴とする。 Also, in the video content generation system of the present invention, the weight calculation means has an infinite number of nodes that can be connected after the node, and nodes that can be connected after the node. And a weight of another node is estimated from the two types of nodes.
また、本発明の映像コンテンツ生成システムにおいて、前記最適パス探索部は、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスであって、最後のノードのウェートが一定量以上であるパスを探索することを特徴とする。 In the video content generation system of the present invention, the optimum path search unit is a path that connects nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph. Thus, a path having a weight of the last node equal to or greater than a certain amount is searched for.
また、本発明の映像コンテンツ生成システムにおいて、前記最適パス探索部は、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスであって、頭の一部のパスのみを決定することを特徴とする。 In the video content generation system of the present invention, the optimum path search unit is a path that connects nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph. Thus, only a part of the head is determined.
また、本発明の映像コンテンツ生成システムにおいて、前記音楽解析部は、前記最適パス探索部の計算時間と音楽のデータレートによって、音楽データの所定量を決定することを特徴とする。 In the video content generation system of the present invention, the music analysis unit determines a predetermined amount of music data according to a calculation time of the optimum path search unit and a music data rate.
また、本発明は、入力された映像コンテンツ生成対象楽曲の音楽データを記憶する記憶部を備え、前記音楽解析部は、次処理で用いる前記音楽データの所定量を、前記記憶部の最大記憶容量またはユーザによる記憶量の指定のうち少ない方のデータ量であって、今回の処理で前記映像データ生成部が生成した映像データの再生時間内に処理可能なデータ量とすることを特徴とする映像コンテンツ生成システムである。 The present invention further includes a storage unit that stores the music data of the input video content generation target music, and the music analysis unit determines a predetermined amount of the music data to be used in the next process as a maximum storage capacity of the storage unit. Alternatively, the video amount is the smaller of the storage amount specified by the user and is a data amount that can be processed within the reproduction time of the video data generated by the video data generation unit in the current processing It is a content generation system.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有することを特徴とするメタデータ構築装置である。 Further, the present invention is included in a motion graph composed of a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content and an edge indicating connectivity of the node. It is a metadata construction apparatus characterized by having a weight calculation means for calculating a weight corresponding to the number of nodes that can be connected after the node for each node.
また、本発明のメタデータ構築装置において、前記ウェート算出手段は、前記ノードの後に連結することができるノード数がゼロになるノードと、前記ノードの後に連結することができるノード数が無限大になるノードとを算出し、上記二種のノードから他のノードのウェートを推定することを特徴とする。 Further, in the metadata construction device of the present invention, the weight calculation means includes a node in which the number of nodes that can be connected after the node is zero, and an infinite number of nodes that can be connected after the node. And a weight of another node is estimated from the two types of nodes.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフと、前記モーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートとを取得する取得部と、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、前記モーショングラフ上で、前記ウェートに基づいて前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスを探索する最適パス探索部と、前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、を備えたことを特徴とする映像コンテンツ生成装置である。 Further, the present invention provides a motion graph composed of a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content, and an edge indicating connectivity of the node, For each node included in the motion graph, an acquisition unit that acquires weights according to the number of nodes that can be connected after the node, and music data of the video content generation target music are input in predetermined amounts in the order of playback and input. A music analysis unit that acquires a music feature value from the predetermined amount of music data, and a node having a motion feature value corresponding to the music feature value of the predetermined amount of music data based on the weight on the motion graph An optimum path search unit for searching for a path connecting groups, and a path corresponding to the path searched by the optimum path search unit. A synchronization unit that generates synchronization information that associates motion data with the predetermined amount of music data, and a video data generation unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information. A video content generation device characterized by comprising the video content generation device.
また、本発明の映像コンテンツ生成装置において、前記最適パス探索部は、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスであって、最後のノードのウェートが一定量以上であるパスを探索することを特徴とする。 In the video content generation device of the present invention, the optimum path search unit is a path that connects nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data on the motion graph. Thus, a path having a weight of the last node equal to or greater than a certain amount is searched for.
また、本発明の映像コンテンツ生成装置において、前記最適パス探索部は、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスであって、頭の一部のパスのみを決定することを特徴とする。 In the video content generation device of the present invention, the optimum path search unit is a path that connects nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data on the motion graph. Thus, only a part of the head is determined.
また、本発明の映像コンテンツ生成装置において、前記音楽解析部は、前記最適パス探索部の計算時間と音楽のデータレートによって、音楽データの所定量を決定することを特徴とする。 In the video content generation apparatus of the present invention, the music analysis unit determines a predetermined amount of music data according to a calculation time of the optimum path search unit and a music data rate.
また、本発明は、入力された映像コンテンツ生成対象楽曲の音楽データを記憶する記憶部を備え、前記音楽解析部は、次処理で用いる前記音楽データの所定量を、前記記憶部の最大記憶容量またはユーザによる記憶量の指定のうち少ない方のデータ量であって、今回の処理で前記映像データ生成部が生成した映像データの再生時間内に処理可能なデータ量とすることを特徴とする。 The present invention further includes a storage unit that stores the music data of the input video content generation target music, and the music analysis unit determines a predetermined amount of the music data to be used in the next process as a maximum storage capacity of the storage unit. Alternatively, the data amount is the smaller of the storage amount designations by the user and can be processed within the reproduction time of the video data generated by the video data generation unit in the current process.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量に基づいて、ノード、エッジおよびエッジの重みを含むモーショングラフを構築するモーショングラフ構築部と、前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、を備え、前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索することを特徴とする携帯端末である。 The present invention also provides a motion graph constructing unit that constructs a motion graph including nodes, edges and edge weights based on feature amounts extracted from motion capture data applicable to video content, and each node of the motion graph. A metadata construction unit for calculating metadata indicating the possibility of synchronization with the music, and music data of the video content generation target music is input in a predetermined amount in the reproduction order, and a music feature amount from the input music data of the predetermined amount And a music analysis unit that acquires a predetermined synchronization possibility that a final node of the node group among the node groups having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data on the motion graph. An optimal path search unit that searches as a path that can connect nodes having the group, and the optimal path search unit searched for A synchronization unit that generates synchronization information that associates the motion data corresponding to the predetermined amount of music data with the predetermined amount of music data, and video data that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information A generation unit , wherein the metadata construction unit includes a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to the video content, and an edge indicating connectivity of the node For each node included in the motion graph composed of: a weight calculating unit that calculates a weight according to the number of nodes that can be connected after the node; and the optimum path searching unit includes: on the basis of the calculated weights is a mobile terminal characterized that you search the path.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量に基づいて、ノード、エッジおよびエッジの重みを含むモーショングラフを構築するモーショングラフ構築部と、前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、前記所定量の音楽データと、当該所定量の音楽データとともに再生される映像データとを配信する配信部と、を備え、前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索することを特徴とする映像コンテンツ配信装置である。 The present invention also provides a motion graph constructing unit that constructs a motion graph including nodes, edges and edge weights based on feature amounts extracted from motion capture data applicable to video content, and each node of the motion graph. A metadata construction unit for calculating metadata indicating the possibility of synchronization with the music, and music data of the video content generation target music is input in a predetermined amount in the reproduction order, and a music feature amount from the input music data of the predetermined amount And a music analysis unit that acquires a predetermined synchronization possibility that a final node of the node group among the node groups having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data on the motion graph. An optimal path search unit that searches as a path that can connect nodes having the group, and the optimal path search unit searched for A synchronization unit that generates synchronization information that associates the motion data corresponding to the predetermined amount of music data with the predetermined amount of music data, and video data that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information A generation unit; and a distribution unit that distributes the predetermined amount of music data and video data reproduced together with the predetermined amount of music data , wherein the metadata constructing unit is a motion applicable to the video content. For each node included in a motion graph composed of a frame node having the same motion feature amount among the feature amounts extracted from the capture data and an edge indicating the connectivity of the node, the nodes can be connected after the node. A weight calculation unit configured to calculate a weight according to the number of nodes, wherein the optimum path search unit includes the weight calculation unit; On the basis of the calculated weights is a video content delivery device comprising a search child said path.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出ステップをコンピュータに実行させるためのコンピュータプログラムである。 Further, the present invention is included in a motion graph composed of a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content and an edge indicating connectivity of the node. This is a computer program for causing a computer to execute a weight calculation step for calculating a weight corresponding to the number of nodes that can be connected after each node for each node.
また、本発明は、映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフと、前記モーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートとを取得する取得ステップと、映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析ステップと、前記モーショングラフ上で、前記ウェートに基づいて前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスを探索する最適パス探索ステップと、前記最適パス探索ステップで探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期ステップと、前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成ステップと、をコンピュータに実行させるためのコンピュータプログラムである。 Further, the present invention provides a motion graph composed of a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content, and an edge indicating connectivity of the node, For each node included in the motion graph, an acquisition step for acquiring a weight according to the number of nodes that can be connected after the node, and music data of the video content generation target music are input in predetermined amounts in the order of playback and input. A music analysis step for obtaining a music feature amount from the predetermined amount of music data, and a node having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data based on the weight on the motion graph An optimal path searching step for searching for paths connecting groups, and the optimal path searching step. Generating synchronization information for associating the motion data corresponding to the path and the predetermined amount of music data, and generating video data to be reproduced together with the predetermined amount of music data based on the synchronization information A computer program for causing a computer to execute a video data generation step.
本発明によれば、映像コンテンツを同期させる楽曲の開始から終了までの音楽データが入力されていなくても、大規模な動きデータベースを利用して楽曲に合わせた映像コンテンツを生成することができるという効果が得られる。 According to the present invention, even if no music data from the start to the end of the music that synchronizes the video content is input, it is possible to generate video content that matches the music using a large-scale motion database. An effect is obtained.
以下、図面を参照し、本発明の実施形態について説明する。
図1は、本発明の一実施形態に係る映像コンテンツ生成システム1の構成を示すブロック図である。図1において、映像コンテンツ生成システム1は、メタデータ構築装置10と、映像コンテンツ生成装置20とを含む。メタデータ構築装置10と、映像コンテンツ生成装置20とは通信可能なネットワーク(図示せず)で接続されており、互いにデータの送受信を行うことができる。メタデータ構築装置10は、動き解析部11と、データベース12とを有する。映像コンテンツ生成装置20は、音楽データ記憶部21と、音楽解析部22と、音楽解析データ記憶部23と、最適パス探索部24と、同期部25と、同期情報記憶部26と、映像データ生成部27と、映像コンテンツ記憶部28と、再生部29とを有する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of a video
映像コンテンツ生成装置20には、映像コンテンツ生成対象の楽曲の音楽データが楽曲ファイル3からストリーミング配信される。
The music data of the music for which video content is generated is streamed from the
動きデータベース2は、一般に利用可能な動きデータ(映像コンテンツに適用可能なモーションキャプチャデータ)を多数蓄積している。メタデータ構築装置10および映像コンテンツ生成装置20は、動きデータベース2から動きデータを入力する。本実施形態では、人の動きデータを扱い、人の動きデータとして、図2に例示されるように定義された人体スケルトン型動きデータを用いる。
The
図2は、人の動きデータの定義例の概略図であり、人のスケルトン型動きデータ(人体スケルトン型動きデータ)の定義例である。人体スケルトン型動きデータは、人の骨格を基に、骨及び骨の連結点(ジョイント)を用い、一ジョイントを根(ルート)とし、ルートからジョイント経由で順次連結される骨の構造を木(ツリー)構造として定義される。図2には、人体スケルトン型動きデータの定義の一部分のみを示している。図2において、ジョイント100は腰の部分であり、ルートとして定義される。ジョイント101は左腕の肘の部分、ジョイント102は左腕の手首の部分、ジョイント103は右腕の肘の部分、ジョイント104は右腕の手首の部分、ジョイント105は左足の膝の部分、ジョイント106は左足の足首の部分、ジョイント107は右足の膝の部分、ジョイント108は右足の足首の部分、である。
FIG. 2 is a schematic diagram of a definition example of human motion data, which is a definition example of human skeleton type motion data (human body skeleton type motion data). Human body skeleton-type motion data is based on the human skeleton, using bone and bone connection points (joints), with one joint as the root (root), and the structure of bones sequentially connected from the root via the joint (tree) Tree) structure. FIG. 2 shows only a part of the definition of the human body skeleton type motion data. In FIG. 2, a joint 100 is a waist part and is defined as a root.
スケルトン型動きデータは、スケルトン型対象物の各ジョイントの動きを記録したデータであり、スケルトン型対象物としては人体や動物、ロボットなどが適用可能である。スケルトン型動きデータとしては、各ジョイントの位置情報や角度情報、速度情報、加速度情報などが利用可能である。ここでは、人体スケルトン型動きデータとして、人体スケルトンの角度情報と加速度情報を例に挙げて説明する。 The skeleton type motion data is data that records the movement of each joint of the skeleton type object, and a human body, an animal, a robot, or the like is applicable as the skeleton type object. As the skeleton type motion data, position information, angle information, speed information, acceleration information, and the like of each joint can be used. Here, human body skeleton angle data and acceleration information will be described as an example of human body skeleton type motion data.
人体スケルトン型角度情報データは、人の一連の動きを複数の姿勢(ポーズ)の連続により表すものであり、人の基本ポーズ(neutral pose)を表す基本ポーズデータと、実際の人の動きの中の各ポーズを表すポーズ毎のフレームデータとを有する。基本ポーズデータは、基本ポーズのときのルートの位置及び各ジョイントの位置、並びに各骨の長さなどの情報を有する。基本ポーズデータにより基本ポーズが特定される。フレームデータは、基本ポーズからの移動量をジョイント毎に表す。ここでは、移動量として角度情報を利用する。各フレームデータにより、基本ポーズに対して各移動量が加味された各ポーズが特定される。これにより、各フレームデータによって特定される各ポーズの連続により、人の一連の動きが特定される。なお、人体スケルトン型角度情報データは、人の動きをカメラ撮影した映像からモーションキャプチャ処理によって作成したり、或いは、キーフレームアニメーションの手作業によって作成したりすることができる。
人体スケルトン型加速度情報データは、人の各ジョイントの加速度をポーズ毎のフレームデータと複数のポーズの連続により表すものである。なお、人体スケルトン型加速度情報データは、加速度計で記録したり、映像や動きデータから算出したりすることができる。
Human skeleton-type angle information data represents a series of human movements by a series of multiple poses, and includes basic pose data that represents a person's basic pose and actual human movements. Frame data for each pose representing each pose. The basic pose data includes information such as the position of the root and the position of each joint in the basic pose, and the length of each bone. The basic pose is specified by the basic pose data. The frame data represents the amount of movement from the basic pose for each joint. Here, angle information is used as the movement amount. Each frame data identifies each pose in which each movement amount is added to the basic pose. Thereby, a series of movements of a person is specified by the continuation of each pose specified by each frame data. The human skeleton-type angle information data can be created by a motion capture process from an image obtained by photographing a person's movement with a camera, or can be created manually by key frame animation.
The human body skeleton type acceleration information data represents the acceleration of each joint of a person by continuous frame data for each pose and a plurality of poses. The human skeleton-type acceleration information data can be recorded by an accelerometer, or calculated from video and motion data.
なお、本実施形態に係る以下の説明においては、人体スケルトン型動きデータのことを単に「動きデータ」と称する。 In the following description according to the present embodiment, the human skeleton type motion data is simply referred to as “motion data”.
以下、図1に示される映像コンテンツ生成システム1に含まれるメタデータ構築装置10の各部について順次説明する。
Hereinafter, each part of the
[動き解析部]
動き解析部11は、動きデータベース2から動きデータを取得し、取得した動きデータを解析して動き特徴量を取得し、取得した動き特徴量をデータベース12に格納する。動き解析部11は、動きデータベース2に蓄積される全ての動きデータを対象にする。この動き解析部11の処理は、実際に映像コンテンツを生成する段階の前に、事前の準備段階として行われる。
[Motion analysis unit]
The
図3は、図1に示す動き解析部11の構成を示すブロック図である。図3において、動き解析部11は、ビート抽出部31、ビート情報記憶部32、盛り上がり算出部33、盛り上がり情報記憶部34及びモーショングラフ生成部35を有する。本実施形態では、モーショングラフ生成部35がモーショングラフ構築部およびメタデータ構築部として動作する。
FIG. 3 is a block diagram illustrating a configuration of the
[ビート抽出部]
ビート抽出部31は、入力された動きデータからビート時刻を検出する。ここで、動きデータのビート時刻は反復的な動きの方向又は強度が変化する時刻である、と定義する。例えば、ダンスなどの動きでは拍子を打つタイミングが相当する。ビート抽出部31は、入力された動きデータを短時間の動きデータに分割し、分割した動き区間から主成分分析によってビート時刻を検出する。
[Beat extractor]
The
以下、本実施形態のビート抽出部31によるビート時刻検出処理について説明する。図4は、図3に示すビート抽出部31の構成を示すブロック図である。図4において、ビート抽出部31は、物理量変換部311、データ分割部312、短時間主成分分析部313、主成分座標連結部314、ビート推定部315及び後処理部316を有する。
Hereinafter, beat time detection processing by the
[物理量変換部]
物理量変換部311は、入力された動きデータにおいて、時刻tにおけるジョイント相対位置を算出する。ジョイント相対位置は、ルートに対するジョイントの相対的な位置である。
[Physical quantity converter]
The physical
ここで、ジョイント相対位置の算出方法を説明する。
まず、人体スケルトン型角度情報データ内の基本ポーズデータとフレームデータを用いて、ジョイント位置を算出する。基本ポーズデータは、基本ポーズのときのルートの位置及び各ジョイントの位置、並びに各骨の長さなど、基本ポーズを特定する情報を有する。フレームデータは、ジョイント毎に、基本ポーズからの移動量の情報を有する。ここでは、移動量として角度情報を利用する。この場合、時刻tにおけるk番目のジョイントの位置pk(t)は、(1)式および(2)式により算出される。pk(t)は3次元座標で表される。なお、時刻tはフレームデータの時刻である。本実施形態では、時刻tを単に「フレームインデックス」として扱う。これにより、時刻tは、0,1,2,・・・,T−1の値をとる。Tは、動きデータに含まれるフレームの個数である。
Here, a method for calculating the joint relative position will be described.
First, joint positions are calculated using basic pose data and frame data in the human skeleton-type angle information data. The basic pose data includes information for specifying the basic pose, such as the position of the root and the position of each joint in the basic pose, and the length of each bone. The frame data has information on the amount of movement from the basic pose for each joint. Here, angle information is used as the movement amount. In this case, the position p k (t) of the k-th joint at time t is calculated by the equations (1) and (2). p k (t) is represented by three-dimensional coordinates. Note that time t is the time of the frame data. In the present embodiment, time t is simply handled as a “frame index”. Thereby, the time t takes values of 0, 1, 2,..., T−1. T is the number of frames included in the motion data.
但し、0番目(i=0)のジョイントはルートである。Raxis i−1,i(t)は、i番目のジョイントとその親ジョイント(「i−1」番目のジョイント)間の座標回転マトリックスであり、基本ポーズデータに含まれる。各ジョイントにはローカル座標系が定義されており、座標回転マトリックスは親子関係にあるジョイント間のローカル座標系の対応関係を表す。Ri(t)は、i番目のジョイントのローカル座標系におけるi番目のジョイントの回転マトリックスであり、フレームデータに含まれる角度情報である。Ti(t)は、i番目のジョイントとその親ジョイント間の遷移マトリックスであり、基本ポーズデータに含まれる。遷移マトリックスは、i番目のジョイントとその親ジョイント間の骨の長さを表す。 However, the 0th (i = 0) joint is the root. R axis i-1, i (t) is a coordinate rotation matrix between the i-th joint and its parent joint ("i-1" -th joint), and is included in the basic pose data. A local coordinate system is defined for each joint, and the coordinate rotation matrix represents the correspondence of the local coordinate system between joints in a parent-child relationship. R i (t) is a rotation matrix of the i-th joint in the local coordinate system of the i-th joint, and is angle information included in the frame data. T i (t) is a transition matrix between the i-th joint and its parent joint, and is included in the basic pose data. The transition matrix represents the bone length between the i-th joint and its parent joint.
次いで、時刻tにおける、ルートに対するk番目のジョイントの相対位置(ジョイント相対位置)p’k(t)を(3)式により算出する。 Next, the relative position (joint relative position) p ′ k (t) of the k-th joint with respect to the root at time t is calculated using equation (3).
但し、proot(t)は時刻tにおけるルート(0番目のジョイント)の位置(p0(t))である。 Here, p root (t) is the position (p 0 (t)) of the route (0th joint) at time t.
これにより、時刻tのフレーム「x(t)」は、「x(t)={p’1(t),p’2(t),・・・,p’K(t)}」と表される。但し、Kは、ルートを除いたジョイントの個数である。 Thus, the frame “x (t)” at time t is expressed as “x (t) = {p ′ 1 (t), p ′ 2 (t),..., P ′ K (t)}”. Is done. K is the number of joints excluding the root.
[データ分割部]
データ分割部312は、ジョイント相対位置データを、一定時間の区間に分割する。データ分割部312は、各ジョイントのジョイント相対位置データ「p’k(t)」に対して、それぞれデータ分割処理を行う。図5にデータ分割処理の概念を示す。データ分割処理では、ジョイント相対位置データを一定時間(一定数のフレーム分に対応)の区間に分割する。分割区間の長さは、適宜、設定可能である。分割区間の長さは、例えば、1フレーム当たりの時間の60倍である。
[Data division part]
The
[短時間主成分分析部]
短時間主成分分析部313は、データ分割部312によって分割されたジョイント相対位置データに対し、各区間で主成分分析処理を行う。ここで、時刻tのフレーム「x(t)」を用いて、一区間のデータ「X」を「X={x(t1),x(t2),・・・,x(tN)}と表す。但し、Nは区間長(区間内に含まれるフレームの個数)である。Xは、M行N列の行列である(但し、M=3×K)。
[Short-term principal component analysis section]
The short-time principal component analysis unit 313 performs principal component analysis processing in each section on the joint relative position data divided by the
主成分分析処理では、Xに対して主成分分析処理を行い、Xを主成分空間へ変換する。 In the principal component analysis processing, principal component analysis processing is performed on X, and X is converted into a principal component space.
ここで、主成分分析方法を説明する。
まず、(4)式により、Xから平均値を除いたN行M列の行列Dを算出する。
Here, the principal component analysis method will be described.
First, the matrix D of N rows and M columns obtained by subtracting the average value from X is calculated by the equation (4).
次いで、(5)式により、N行M列の行列Dに対して特異値分解(Singular Value Decomposition)を行う。 Next, singular value decomposition (Singular Value Decomposition) is performed on the matrix D of N rows and M columns according to the equation (5).
但し、Uは、N行N列のユニタリ行列である。Σは、N行M列の負でない対角要素を降順にもつ対角行列であり、主成分空間の座標の分散を表す。Vは、M行M列のユニタリ行列であり、主成分に対する係数(principal component)である。 However, U is a unitary matrix of N rows and N columns. Σ is a diagonal matrix having non-negative diagonal elements of N rows and M columns in descending order, and represents the variance of the coordinates of the principal component space. V is a unitary matrix of M rows and M columns, and is a coefficient (principal component) for the principal component.
次いで、(6)式により、N行M列の行列Dを主成分空間へ変換する。M行N列の行列Yは、主成分空間の座標を表す。 Next, the matrix D of N rows and M columns is converted into the principal component space by the equation (6). The matrix Y with M rows and N columns represents the coordinates of the principal component space.
短時間主成分分析部313は、区間毎に、主成分空間の座標を表す行列(主成分座標行列)Yと、主成分に対する係数の行列(主成分係数行列)Vをメモリに保存する。 The short-time principal component analysis unit 313 stores a matrix (principal component coordinate matrix) Y representing the coordinates of the principal component space and a coefficient matrix (principal component coefficient matrix) V for the principal components in a memory for each section.
なお、元空間の座標を表す行列Xと主成分座標行列Yは、(6)式と(7)式により相互に変換することができる。 Note that the matrix X representing the coordinates of the original space and the principal component coordinate matrix Y can be converted into each other by the equations (6) and (7).
また、上位のr個の主成分によって、(8)式により変換することができる。 Moreover, it can convert by (8) Formula by the upper r main components.
但し、Vrは、主成分係数行列V内の上位のr個の行から成るM行r列の行列である。Yrは、主成分座標行列Y内の上位のr個の列から成るr行N列の行列である。X〜は、復元されたM行N列の行列である。 Here, V r is a matrix of M rows and r columns composed of upper r rows in the principal component coefficient matrix V. Y r is an r-row N-column matrix composed of the upper r columns in the principal component coordinate matrix Y. X ~ is a matrix of reconstructed M rows and N columns.
なお、元空間の一部の自由度だけを主成分分析処理することも可能である。例えば、足の動きだけでビートを表現することができる場合には、足に関するジョイント相対位置データのみから生成したM’行N列の行列X’に対して、(4)式、(5)式及び(6)式により主成分分析処理を行う。 Note that it is also possible to perform principal component analysis processing on only some degrees of freedom of the original space. For example, when the beat can be expressed only by the movement of the foot, the equations (4) and (5) are applied to the M ′ × N matrix X ′ generated only from the joint relative position data regarding the foot. And the principal component analysis processing is performed by the equation (6).
[主成分座標連結部]
主成分座標連結部314は、各区間の主成分の座標を、時系列に沿って連結する。この主成分座標連結部314が行う主成分座標連結処理では、連続する2つの区間の境界部分において、主成分の座標が滑らかに連結されるように、主成分の座標を調整する。
[Principal component coordinate connection part]
The principal component coordinate
図6に、本実施形態に係る主成分座標連結処理を説明するための概念図を示す。本実施形態では、時系列に従って、先頭の区間から順番に主成分座標連結処理を行ってゆく。図6において、ある区間(前区間)までの主成分座標連結処理が終了している。そして、その前区間に対して、次の区間(当区間)を連結するための主成分座標連結処理を行う。この主成分座標連結処理では、前区間の主成分座標に対し、当区間の主成分座標が滑らかに連結されるように、当区間の主成分座標を調整する。この主成分座標の調整処理では、主成分選択ステップによって選択された当区間の主成分座標(元座標)に対し、符号反転又は座標シフトを行う。 In FIG. 6, the conceptual diagram for demonstrating the principal component coordinate connection process which concerns on this embodiment is shown. In the present embodiment, principal component coordinate connection processing is performed in order from the top section in time series. In FIG. 6, the principal component coordinate connection process up to a certain section (previous section) has been completed. And the principal component coordinate connection process for connecting the next area (this area) is performed with respect to the previous area. In this principal component coordinate connection process, the principal component coordinates of the current section are adjusted so that the principal component coordinates of the current section are smoothly connected to the principal component coordinates of the previous section. In this principal component coordinate adjustment processing, sign inversion or coordinate shift is performed on the principal component coordinates (original coordinates) in the current section selected in the principal component selection step.
ここで、主成分座標連結処理を説明する。 Here, the principal component coordinate connection process will be described.
主成分座標連結ステップS11:当区間の主成分の座標(第1主成分の元座標)Y1に対し、当区間の主成分係数行列Vから、第1主成分に対する係数V1を取得する。さらに、メモリに保存されている前区間の主成分係数行列Vから、第1主成分に対する係数V1 preを取得する。 Principal component coordinate connection Step S11: relative Y 1 (original coordinates of the first principal component) This section of the main components of the coordinates, the principal component coefficient matrix V of this section, to obtain the coefficients V 1 for the first principal component. Further, the coefficient V 1 pre for the first principal component is obtained from the principal component coefficient matrix V of the previous section stored in the memory.
主成分座標連結ステップS12:当区間に係る第1主成分に対する係数V1と前区間に係る第1主成分に対する係数V1 preとの関係に基づいて、当区間に係る第1主成分の元座標を符号反転するか否かを判定する。この符号反転の判定は、(9)式により行う。(9)式による判定の結果、符号反転する場合には、当区間の第1主成分の元座標Y1に対して符号反転を行うと共に、当区間の主成分係数行列Vに対しても符号反転を行う。一方、(9)式による判定の結果、符号反転しない場合には、当区間の第1主成分の元座標Y1及び当区間の主成分係数行列Vともに、そのままの値を主成分座標連結ステップS12の処理結果とする。 Principal component coordinate connection step S12: Based on the relationship between the coefficient V 1 pre respect to the first principal component of the front section and the coefficient V 1 for a first principal component of the skilled interval, the first principal component of the original according to those sections It is determined whether or not the coordinates of the coordinates are reversed. This sign inversion determination is made by equation (9). (9) of the determination by the formula result, in the case of sign inversion, performs sign inversion on the original coordinate Y 1 of the first principal component of this section, reference numerals with respect to the main component coefficient matrix V of this section Invert. On the other hand, (9) of the determination by the formula result, code if not reversed, both principal component coefficient matrix V of the first principal component source coordinates Y 1 and those sections of those sections, the main component coordinate coupling step the raw values The processing result of S12 is used.
但し、Y1は、当区間で選択された主成分の座標(第1主成分の元座標)である。Vは、当区間の主成分係数行列である。V1は、当区間に係る第1主成分に対する係数である。V1 preは、前区間に係る第1主成分に対する係数である。(V1・Vk pre)は、V1とV1 preの内積である。Y1’は、当区間で選択された主成分の座標(第1主成分の元座標)Y1に対する主成分座標連結ステップS12の処理結果である。V’は、当区間の主成分係数行列Vに対する主成分座標連結ステップS12の処理結果である。 However, Y 1 is selected principal component in this section coordinate (original coordinate of the first principal component). V is a principal component coefficient matrix of this section. V 1 is a coefficient for the first principal component in the current section. V 1 pre is a coefficient for the first principal component related to the previous section. (V 1 · V k pre ) is an inner product of V 1 and V 1 pre . Y 1 ′ is a processing result of the principal component coordinate connection step S12 for the principal component coordinates (original coordinates of the first principal component) Y 1 selected in the current section. V ′ is the processing result of the principal component coordinate connection step S12 for the principal component coefficient matrix V in the current section.
主成分座標連結ステップS13:主成分座標連結ステップS12の処理結果の主成分座標Y1’に対し、座標シフトを行う。具体的には、(10)式により座標シフトを行う。この場合、前区間の主成分座標行列Yから、前区間の第tNフレームにおける第1主成分の座標Y1 pre(tN)を取得する。 Principal component coordinate connection step S13: Coordinate shift is performed on the principal component coordinate Y 1 ′ of the processing result of the principal component coordinate connection step S12. Specifically, the coordinate shift is performed by the equation (10). In this case, the coordinate Y 1 pre (tN) of the first principal component in the tN frame of the previous section is acquired from the principal component coordinate matrix Y of the previous section.
但し、Y1’(t1)は、ステップS12の処理結果の主成分座標Y1’のうち、第t1フレームの座標である。Y1”(t2)は、(10)式の最初の計算式の計算結果の座標Y1”のうち、第t2フレームの座標である。
(10)式の最初の計算式の計算結果の座標Y1”に対し、第t1フレームの座標Y1”(t1)をY1 opt(t1)に置き換える。この置き換え後の座標Y1”が、座標シフト結果の座標である。
However, Y 1 '(t1), the main component coordinate Y 1 of the processing result of step S12' of the coordinates of the t1 frame. Y 1 ″ (t2) is the coordinate of the t2 frame among the coordinates Y 1 ″ of the calculation result of the first calculation formula of Formula (10).
The coordinate Y 1 ″ (t1) of the t1 frame is replaced with Y 1 opt (t1) with respect to the coordinate Y 1 ″ of the calculation result of the first calculation expression of the equation (10). This replaced coordinate Y 1 ″ is the coordinate shift result coordinate.
主成分座標連結ステップS14:当区間において、主成分座標連結ステップS12の処理結果の座標Y1’に対して、主成分座標連結ステップS13の処理結果の座標Y1 opt(t1)を反映する。これにより、当区間の主成分座標は、前区間の主成分座標に対して滑らかに連結されるものとなる。 Principal component coordinate connection step S14: In this section, the coordinate Y 1 opt (t1) of the processing result of the principal component coordinate connection step S13 is reflected on the coordinate Y 1 ′ of the processing result of the principal component coordinate connection step S12. Thereby, the principal component coordinates of the current section are smoothly connected to the principal component coordinates of the previous section.
主成分座標連結部314は、上記した主成分座標連結処理を最初の区間から最後の区間まで行う。これにより、連結後の全区間の主成分座標「y(t)、t=0,1,2,・・・,T−1」が求まる。但し、Tは、動きデータに含まれるフレームの個数である。
The principal component coordinate
[ビート推定部]
ビート推定部315は、主成分座標連結部314によって算出された連結後の全区間の主成分座標y(t)から、極値b(j)を算出する。この算出結果の極値b(j)がビートに対応する。ビートの集合Bは、(11)式で表される。
[Beat estimation unit]
The
但し、Jは、ビートの個数である。 Here, J is the number of beats.
なお、ビートの集合の算出は、上記した方法以外の方法でも可能である。
例えば、ビート推定部315は、主成分座標連結部314によって算出された連結後の全区間の主成分座標から自己相関値を算出し、該自己相関値の極値b(j)をビートに対応するものとして算出することができる。
また、ビート推定部315は、主成分座標連結部314によって、連結後の隣区間の主成分係数から算出した内積((9)式によるもの)の自己相関値を算出し、該自己相関値の極値b(j)をビートに対応するものとして算出することができる。
The beat set can be calculated by a method other than the method described above.
For example, the
In addition, the
[後処理部]
後処理部316は、ビート推定部315によって算出されたビート集合Bから、ビート時刻を検出する。
[Post-processing section]
The
ここで、ビート時刻検出処理を説明する。
まず、ビート集合B内の各極値間を、(12)式により正弦曲線(sinusoid)で近似する。
Here, the beat time detection process will be described.
First, each extreme value in the beat set B is approximated by a sine curve (sinusoid) by the equation (12).
但し、sj−1(t)は、(j−1)番目の極値b(j−1)からj番目の極値b(j)までの区間の正弦近似値である。tはフレームに対応する時刻であり、「t=0,1,2,・・・,T−1」である。Tは、動きデータに含まれるフレームの個数である。 Here, s j−1 (t) is an approximate sine value in a section from the (j−1) th extreme value b (j−1) to the jth extreme value b (j). t is the time corresponding to the frame, and is “t = 0, 1, 2,..., T−1”. T is the number of frames included in the motion data.
図7に、(12)式による正弦近似処理の概念図を示す。図7において、1番目の極値b(1)から2番目の極値b(2)までの区間a1(j=2の場合の区間)は、s1(t)で近似される。同様に、2番目の極値b(2)から3番目の極値b(3)までの区間a2(j=3の場合の区間)はs2(t)で近似され、3番目の極値b(3)から4番目の極値b(4)までの区間a3(j=4の場合の区間)はs3(t)で近似され、4番目の極値b(4)から5番目の極値b(5)までの区間a4(j=5の場合の区間)はs4(t)で近似される。 FIG. 7 shows a conceptual diagram of the sine approximation process according to equation (12). In FIG. 7, a section a1 (section in the case of j = 2) from the first extreme value b (1) to the second extreme value b (2) is approximated by s 1 (t). Similarly, a section a2 (section when j = 3) from the second extreme value b (2) to the third extreme value b (3) is approximated by s 2 (t), and the third extreme value The section a3 (section in the case of j = 4) from b (3) to the fourth extreme value b (4) is approximated by s 3 (t), and the fifth extreme value b (4) to the fifth A section a4 (section when j = 5) up to the extreme value b (5) is approximated by s 4 (t).
次いで、正弦近似値「sj−1(t)、j=2,3,・・・,J」に対してフーリエ変換を行う。そのフーリエ変換処理には、所定のFFTポイント数Lのハン窓を用いたFFT(Fast Fourier Transform)演算器を使用する。そして、そのフーリエ変換の結果に基づいて、該フーリエ変換に係る周波数範囲のうちから最大の成分を有する周波数(最大成分周波数)fmaxを検出する。そして、ビート間隔TBを「TB=Fs÷fmax」なる計算式により算出する。但し、Fsは、1秒当たりのフレーム数である。 Next, Fourier transform is performed on the sine approximation “s j−1 (t), j = 2, 3,..., J”. In the Fourier transform process, an FFT (Fast Fourier Transform) calculator using a Hann window with a predetermined number of FFT points L is used. Based on the result of the Fourier transform, a frequency (maximum component frequency) fmax having the maximum component is detected from the frequency range related to the Fourier transform. Then, the beat interval TB is calculated by the calculation formula “TB = Fs ÷ fmax”. However, Fs is the number of frames per second.
次いで、正弦近似値「sj−1(t)、j=2,3,・・・,J」と、(13)式で定義される基準値「s’(t)」との間の最大相関初期位相を(14)式により算出する。 Next, the maximum between the sine approximation “s j−1 (t), j = 2, 3,..., J” and the reference value “s ′ (t)” defined by the equation (13) The correlation initial phase is calculated by equation (14).
次いで、(15)式により、ビート時刻eb(j)の集合EBを算出する。但し、EJは、ビート時刻eb(j)の個数である。 Next, a set EB of beat times eb (j) is calculated by the equation (15). However, EJ is the number of beat times eb (j).
以上が本実施形態のビート抽出部31によるビート時刻検出処理の説明である。
The above is the description of the beat time detection processing by the
ビート抽出部31は、上述のビート時刻検出方法によって、動きデータからビート時刻eb(j)の集合EBを算出する。さらに、ビート抽出部31は、(16)式により、動きのテンポを算出する。動きのテンポは、1分間当たりのビートの個数である。ここでは、1秒当たりのフレーム数は120である。
The
但し、TBはビート間隔(秒)である。 Where TB is the beat interval (seconds).
ビート抽出部31は、各動きデータについて、ビート時刻eb(j)の集合EBとテンポをビート情報記憶部32に格納する。このとき、ビート抽出部31が主成分分析処理を行った区間(主成分分析区間)とビート時刻eb(j)の対応関係を表す情報もビート情報記憶部32に格納する。これにより、あるビート時刻がどの主成分分析区間に属するのかが分かる。
The
[盛り上がり算出部]
盛り上がり算出部33は、各動きデータについて、主成分分析区間ごとに、(17)式により、動きの盛り上がりを算出する。
[Rise calculation part]
The
但し、Σは当該区間の主成分分析処理における負でない固有値を降順にもつ対角行列であり、主成分空間の座標の分散を表す。tr()は、対角行列の対角成分の和(matrix trace)である。 However, Σ is a diagonal matrix having non-negative eigenvalues in descending order in the principal component analysis processing of the section, and represents the variance of the coordinates of the principal component space. tr () is the sum of the diagonal components of the diagonal matrix (matrix trace).
盛り上がり算出部33は、各動きデータについて、各主成分分析区間の盛り上がりを盛り上がり情報記憶部34に格納する。
The
[モーショングラフ生成部]
モーショングラフ生成部35は、各動きデータの、ビート時刻eb(j)の集合EB、テンポ及び盛り上がりを用いて、モーショングラフを生成する。モーショングラフについては非特許文献4に開示されている。モーショングラフは、ノード(頂点)群とノード間の連結関係を表すエッジ(枝)群とエッジの重みから構成される。エッジには双方向と単方向の2種類がある。
[Motion graph generator]
The motion
図8は、本実施形態に係るモーショングラフの構成方法の全体の流れを示す概念図である。
動きデータベース2内の動きデータは、ジャンル別に分類される。動きデータベース2内の動きデータのジャンルは、予め設定される。そのジャンル分けは動きの特徴によって行われる。各動きデータには、所属するジャンルを示す情報が付加されている。モーショングラフ生成部35は、動きデータに付加されたジャンル情報によって、動きデータのジャンルを判別する。図8の例では、動きデータベース2内の動きデータは、n個のジャンルデータベース(ジャンル1DBからジャンルnDB)に分類される。
FIG. 8 is a conceptual diagram showing the overall flow of the motion graph construction method according to this embodiment.
The motion data in the
モーショングラフ生成部35は、同じジャンルに属する動きデータについて、さらに、(18)式で算出される値iにより分類する。図8の例では、ジャンル2に属する動きデータは、m個のテンポデータベース(テンポ1DBからテンポmDB)に分類される。
The motion
但し、QTempoはテンポの区間の長さである。TempoMotionは分類対象の動きデータに係るテンポである。TempoMotion minは分類対象のジャンル内で最小のテンポである。 However, Q Tempo is the length of the tempo interval. Tempo Motion is a tempo related to motion data to be classified. Tempo Motion min is the minimum tempo in the category to be classified.
モーショングラフ生成部35は、同じジャンルに属する動きデータについて、さらに(18)式の算出値iで分類されたテンポデータベース毎に、モーショングラフを生成する。
The motion
図9は、本実施形態に係るモーショングラフ生成方法の流れを示す概念図である。以下、図9を参照して、あるジャンルのあるテンポデータベース(テンポiDB)のモーショングラフを生成する手順を説明する。 FIG. 9 is a conceptual diagram showing a flow of a motion graph generation method according to the present embodiment. Hereinafter, a procedure for generating a motion graph of a certain tempo database (tempo iDB) will be described with reference to FIG.
[ビートフレーム抽出ステップ]
まず、ビートフレーム抽出ステップでは、テンポiDBに属する全ての動きデータから、ビート時刻に該当するフレーム(ビートフレーム)を全て抽出する。この抽出されたビートフレームの集合をFiALL Bと表す。
[Beat frame extraction step]
First, in the beat frame extraction step, all frames (beat frames) corresponding to the beat time are extracted from all motion data belonging to the tempo iDB. The set of extracted beat frames is represented as Fi ALL B.
[連結性算出ステップ]
次いで、連結性算出ステップでは、集合FiALL Bに含まれる全ビートフレームを対象とした全てのペアについて、(19)式又は(20)式により距離を算出する。あるビートフレームFi BとあるビートフレームFj Bとの距離をd(Fi B,Fj B)と表す。
[Connectivity calculation step]
Next, in the connectivity calculation step, distances are calculated for all pairs targeted for all beat frames included in the set F iALL B by using the equation (19) or (20). The distance between a certain beat frame F i B and a certain beat frame F j B is represented as d (F i B , F j B ).
但し、qi,kはビートフレームFi Bのk番目のジョイントの四元数(quaternion)である。wkはk番目のジョイントに係る重みである。重みwkは予め設定される。例えば、重みwkの例としては図10に示すとおりである。図10はジョイント毎に予め定めた重みを示した図である。図示する例では、Right and Left Hipの重みは1.0000である。また、Right and Left Kneeの重みは0.0901である。また、Right and Left Shoulderの重みは0.7884である。また、Right and Left Elbowの重みは0.0247である。 Where q i, k is the quaternion of the kth joint of the beat frame F i B. w k is a weight related to the k-th joint. The weight w k is preset. For example, an example of the weight w k is as shown in FIG. FIG. 10 is a diagram showing weights predetermined for each joint. In the illustrated example, the weight of Right and Left Hip is 1.0000. The weight of Right and Left Knee is 0.0901. The weight of Right and Left Shoulder is 0.7884. The weight of Right and Left Elbow is 0.0247.
但し、pi,kはビートフレームFi Bのk番目のジョイントのルートに対する相対位置のベクトルである。つまり、pi,kは、ルートの位置と方向は考えずに算出したビートフレームFi Bのk番目のジョイントの位置のベクトルである。 Here, p i, k is a vector of relative positions with respect to the root of the k-th joint of the beat frame F i B. That is, p i, k is a vector of the position of the k-th joint of the beat frame F i B calculated without considering the position and direction of the route.
なお、ビートフレーム間の距離は、対象ビートフレームにおけるポーズを構成する各ジョイントの位置、速度、加速度、角度、角速度、角加速度などの物理量の差分の重み付き平均として算出することができる。 The distance between beat frames can be calculated as a weighted average of differences in physical quantities such as the position, velocity, acceleration, angle, angular velocity, and angular acceleration of each joint constituting a pose in the target beat frame.
次いで、連結性算出ステップでは、(21)式により、連結性を算出する。あるビートフレームFi BとあるビートフレームFj Bとの連結性をc(Fi B,Fj B)と表す。 Next, in the connectivity calculation step, the connectivity is calculated according to equation (21). The connectivity between a certain beat frame F i B and a certain beat frame F j B is represented as c (F i B , F j B ).
但し、d(Fi B)はビートフレームFi Bの前フレームと後フレームの間の距離である((19)式又は(20)式と同様の計算式で算出する)。THは予め設定される閾値である。 However, d (F i B ) is a distance between the previous frame and the rear frame of the beat frame F i B (calculated by a calculation formula similar to the formula (19) or the formula (20)). TH is a preset threshold value.
連結性c(Fi B,Fj B)が1である場合、ビートフレームFi BのポーズとビートフレームFj Bのポーズは似ていると判断できる。連結性c(Fi B,Fj B)が0である場合、ビートフレームFi BのポーズとビートフレームFj Bのポーズは似ているとは判断できない。 When the connectivity c (F i B , F j B ) is 1, it can be determined that the pose of the beat frame F i B and the pose of the beat frame F j B are similar. When the connectivity c (F i B , F j B ) is 0, it cannot be determined that the pose of the beat frame F i B and the pose of the beat frame F j B are similar.
[モーショングラフ構築ステップ]
次いで、モーショングラフ構築ステップでは、まず、集合FiALL Bに含まれる全ビートフレームをそれぞれ、モーショングラフのノードに設定する。従って、モーショングラフのノード数の初期値は、集合FiALL Bに含まれるビートフレームの個数に一致する。
[Motion graph construction step]
Next, in the motion graph construction step, first, all the beat frames included in the set F iALL B are set as the nodes of the motion graph. Therefore, the initial value of the number of nodes in the motion graph matches the number of beat frames included in the set F iALL B.
次いで、連結性c(Fi B,Fj B)が1である場合、ビートフレームFi BのノードとビートフレームFj Bのノードの間に双方向のエッジを設ける。連結性c(Fi B,Fj B)が0である場合には、ビートフレームFi BのノードとビートフレームFj Bのノードの間に双方向のエッジを設けない。 Next, when the connectivity c (F i B , F j B ) is 1, a bidirectional edge is provided between the node of the beat frame F i B and the node of the beat frame F j B. When the connectivity c (F i B , F j B ) is 0, no bi-directional edge is provided between the node of the beat frame F i B and the node of the beat frame F j B.
次いで、同じ動きデータの中で隣接するビートフレーム間には、単方向のエッジを設ける。単方向のエッジは、時間的に前のビートフレームのノードから後のビートフレームのノードへ向かう。 Next, a unidirectional edge is provided between adjacent beat frames in the same motion data. A unidirectional edge is temporally directed from the node of the previous beat frame to the node of the subsequent beat frame.
次いで、双方向のエッジに対する重みを算出する。ビートフレームFi BのノードとビートフレームFj Bのノードの間の双方向エッジに対する重みは、(22)式により算出する。 Next, a weight for the bidirectional edge is calculated. The weight for the bidirectional edge between the node of the beat frame F i B and the node of the beat frame F j B is calculated by the equation (22).
但し、rdは(21)式で算出したものである。 However, rd is calculated by the equation (21).
次いで、単方向のエッジに対する重みを算出する。ビートフレームFi BのノードとビートフレームFj Bのノードの間の単方向エッジに対する重みは、次の(a),(b)のいずれかの方法で値を決定する。
(a)ビートフレームFi BとビートフレームFj Bが同じ主成分分析区間に属する場合、当該主成分分析区間の盛り上がりを重みに用いる。
(b)ビートフレームFi BとビートフレームFj Bが異なる主成分分析区間に属する場合、ビートフレームFi Bが属する主成分分析区間の盛り上がりとビートフレームFj Bが属する主成分分析区間の盛り上がりを平均した値を重みに用いる。
Next, a weight for a unidirectional edge is calculated. The weight for the unidirectional edge between the node of the beat frame F i B and the node of the beat frame F j B is determined by one of the following methods (a) and (b).
(A) When the beat frame F i B and the beat frame F j B belong to the same principal component analysis section, the rise of the principal component analysis section is used as a weight.
(B) When the beat frame F i B and the beat frame F j B belong to different principal component analysis sections, the rise of the principal component analysis section to which the beat frame F i B belongs and the principal component analysis section to which the beat frame F j B belongs A value obtained by averaging the swells is used as the weight.
次いで、双方向エッジの両端のノード(ビートフレーム)に係る動きデータに対して、ブレンディング(blending)処理を行う。ブレンディング処理は、双方向エッジの方向ごとに、それぞれ行う。従って、一つの双方向エッジに対して、図11(1),(2)に示されるように、2つのブレンディング処理を行うことになる。図11は、ビートフレームiのノードとビートフレームjのノードの間の双方向エッジに係るブレンディング処理の概念図である。図11(1)はビートフレームiのノードからビートフレームjのノードへ向かう方向に係るブレンディング処理を表し、図11(2)はビートフレームjのノードからビートフレームiのノードへ向かう方向に係るブレンディング処理を表す。 Next, blending processing is performed on motion data related to nodes (beat frames) at both ends of the bidirectional edge. The blending process is performed for each bidirectional edge direction. Accordingly, two blending processes are performed on one bidirectional edge as shown in FIGS. 11 (1) and (2). FIG. 11 is a conceptual diagram of blending processing related to a bidirectional edge between a node of beat frame i and a node of beat frame j. FIG. 11 (1) shows the blending process in the direction from the node of beat frame i to the node of beat frame j, and FIG. 11 (2) shows the blending in the direction from the node of beat frame j to the node of beat frame i. Represents a process.
図12は、ブレンディング処理を説明する概念図であり、図11(1)に対応している。ここでは、図12を参照し、図11(1)に示されるビートフレームiのノードからビートフレームjのノードへ向かう方向に係るブレンディング処理を例に挙げて説明する。 FIG. 12 is a conceptual diagram illustrating the blending process, and corresponds to FIG. 11 (1). Here, with reference to FIG. 12, a blending process in the direction from the node of beat frame i to the node of beat frame j shown in FIG.
ブレンディング処理では、ビートフレームiを有する動きデータ1とビートフレームjを有する動きデータ2に対して、動きのつながりが不自然にならないように、両者の動きデータの接続部分を混合した補間データ(ブレンディング動きデータ)1_2を生成する。本実施形態では、一定時間分のフレームを使用しクォータニオンによる球面線形補間を利用して連結部分を補間する。具体的には、動きデータ1と動きデータ2を接続する接続区間(区間長m、但し、mは所定値)のブレンディング動きデータ1_2を、動きデータ1のうち最後の区間長mのデータ1_mと動きデータ2のうち最初の区間長mのデータ2_mを用いて生成する。このとき、接続区間の区間長mに対する接続区間の先頭からの距離uの比(u/m)に応じて、データ1_mのうち距離uに対応するフレームiとデータ2_mのうち距離uに対応するフレームjを混合する。具体的には、(23)式および(24)式により、ブレンディング動きデータ1_2を構成する各フレームを生成する。なお、(23)式は、ある一つの骨についての式となっている。
In the blending process, interpolated data (blending) in which the
但し、mはブレンディング動きデータ1_2を構成するフレーム(ブレンディングフレーム)の総数(所定値)、uはブレンディングフレームの先頭からの順番(1≦u≦m)、qはu番目のブレンディングフレームにおける骨の四元数、qi(k,u)はフレームiにおける第uフレームの第k骨の四元数、qj(k,u)はフレームjにおける第uフレームの第k骨の四元数、qb(k,u)はブレンディングフレームにおける第uフレームの第k骨の四元数である。但し、ルートにはブレンディングを行わない。なお、(24)式はslerp(spherical linear interpolation)の算出式である。 Where m is the total number (predetermined value) of frames (blending frames) constituting the blending motion data 1_2, u is the order from the top of the blending frame (1 ≦ u ≦ m), and q is the bone of the u-th blending frame. The quaternion, q i (k, u) is the quaternion of the k-th bone of the u-th frame in frame i, q j (k, u) is the quaternion of the k-th bone of the u-th frame in frame j, q b (k, u) is a quaternion of the k-th bone of the u-th frame in the blending frame. However, blending is not performed on the route. Equation (24) is a calculation formula for slerp (spherical linear interpolation).
ブレンディング動きデータ1_2は、動きデータ1と動きデータ2の接続部分のデータとする。
The blending motion data 1_2 is data of a connection portion between the
次いで、ノードのウェート(ノードの重み、楽曲との同期可能性を示すメタデータ)を算出する。ノードのウェートは、自ノードの後に連結することができるノードの数を示す。ノードのウェートにより、ノードをTYPE1、TYPE2、TYPE3の三種類に分類することができる。 Next, node weights (node weights, metadata indicating the possibility of synchronization with music) are calculated. The node weight indicates the number of nodes that can be connected after the self node. Depending on the weight of the node, the node can be classified into three types of TYPE1, TYPE2, and TYPE3.
TYPE1に分類されるノードは、自ノードの後に無限大にノードを連結することができるノードである。TYPE1に分類されるノードのウェートは無限大である。例えば、ループに含まれているノードや、ループに含まれているノードを連結することができるノードは、このループに含まれているノードを自ノードの後に連結することができるので、無限大にノードを連結することができる。 A node classified as TYPE1 is a node that can connect nodes indefinitely after its own node. The weight of a node classified as TYPE1 is infinite. For example, a node that can be connected to a node that is included in a loop or a node that is included in a loop can be connected to the node that is included in this loop after its own node. Nodes can be linked.
TYPE2に分類されるノードは、末端ノードおよび付属ノードである。末端ノードは、自ノードの後にノードを連結することができないノードである。例えば、双方向エッジと片方向エッジとが無いノードである。末端ノードのウェートは0である。付属ノードは、片方向エッジのみが末端ノードあるいは付属ノードに連結するノードである。付属ノードのウェートは、子供ノード(自ノードの直後に連結しているノード)のウェートに1を加算した値である。 Nodes classified as TYPE2 are end nodes and attached nodes. A terminal node is a node that cannot connect nodes after its own node. For example, a node without a bidirectional edge and a unidirectional edge. The weight of the end node is zero. An attached node is a node in which only a one-way edge is connected to a terminal node or an attached node. The weight of the attached node is a value obtained by adding 1 to the weight of the child node (node connected immediately after the own node).
TYPE3に分類されるノードは、TYPE1およびTYPE2の何れにも分類されないノードである。TYPE3に分類されるノードは、後述する同期処理では使用しない。
A node classified as TYPE3 is a node that is not classified as either TYPE1 or TYPE2. Nodes classified as
例えば、図9に示したノード901〜921のうち、TYPE1に分類されるノードは、ノード901〜906,908〜913,915〜917である。これらのノードのウェートは無限大である。また、ノード901〜921のうち、TYPE2に分類されるノードは、ノード907,914,918〜921である。ノード907,914は末端ノードであり、ウェートは0である。ノード918〜920は付属ノードであり、ノード920のウェートは1であり、ノード919のウェートは2であり、ノード918のウェートは3である。
For example, among the
ここで、ノードのウェートの算出処理を説明する。 Here, the process of calculating the weight of the node will be described.
ノードウェート算出ステップS21:モーショングラフのノードのうち、ループに含まれているノードや、ループに含まれているノードを連結することができるノードをTYPE1のノードに特定する。その後、ノードウェート算出ステップS22の処理を行う。 Node weight calculation step S21: Among the nodes of the motion graph, a node included in the loop and a node capable of connecting nodes included in the loop are specified as a node of TYPE1. Thereafter, the process of the node weight calculation step S22 is performed.
ノードウェート算出ステップS21において、例えば、図13に示す処理を行い、ループを特定する。
(ステップS101)全てのノードの色を「白」とする。その後、ステップS102の処理に進む。
(ステップS102)当ノードuの色を「グレー」とする。その後、ステップS103の処理に進む。
(ステップS103)子ノードvがある場合にはステップS106の処理に進み、それ以外の場合にはステップS104の処理に進む。
(ステップS104)当ノードuの色を「黒」とする。その後、ステップS105の処理に進む。
(ステップS105)当ノードuを親ノードとする。その後、ステップS103の処理に戻る。
(ステップS106)ノードvの色が「白」である場合にはステップS107の処理に進み、それ以外の場合にはステップS109の処理に進む。
(ステップS107)ノードvの親をノードuとする。その後、ステップS108の処理に進む。
(ステップS108)当ノードuをノードvとする。その後、ステップS102の処理に戻る。
(ステップS109)ループがあると判定し、処理を終了する。
In the node weight calculation step S21, for example, the process shown in FIG. 13 is performed to identify the loop.
(Step S101) The color of all nodes is set to “white”. Thereafter, the process proceeds to step S102.
(Step S102) The color of this node u is set to “gray”. Thereafter, the process proceeds to step S103.
(Step S103) If there is a child node v, the process proceeds to step S106; otherwise, the process proceeds to step S104.
(Step S104) The color of the current node u is set to “black”. Thereafter, the process proceeds to step S105.
(Step S105) This node u is set as a parent node. Thereafter, the process returns to step S103.
(Step S106) If the color of the node v is “white”, the process proceeds to step S107. Otherwise, the process proceeds to step S109.
(Step S107) The parent of the node v is set as the node u. Thereafter, the process proceeds to step S108.
(Step S108) This node u is set as a node v. Thereafter, the process returns to step S102.
(Step S109) It is determined that there is a loop, and the process is terminated.
ノードウェート算出ステップS22:TYPE1に分類されるノードを除いたモーショングラフのノードのうち、末端ノードおよび付属ノードを特定し、これらのノードをTYPE2に分類されるノードと特定する。その後、ノードウェート算出ステップS23の処理を行う。 Node weight calculation step S22: Among the nodes of the motion graph excluding nodes classified as TYPE1, end nodes and attached nodes are identified, and these nodes are identified as nodes classified as TYPE2. Thereafter, the process of the node weight calculation step S23 is performed.
ノードウェート算出ステップS23:モーショングラフのノードのうち、TYPE1とTYPE2に分類されるノードを除いたノードをTYPE3に分類されるノードと特定する。その後、ノードウェート算出処理を終了する。 Node weight calculation step S23: Among the nodes of the motion graph, nodes other than those classified as TYPE1 and TYPE2 are identified as nodes classified as TYPE3. Thereafter, the node weight calculation process is terminated.
以上のモーショングラフ構築ステップによって、あるジャンルのあるテンポデータベース(テンポiDB)のモーショングラフのデータが生成される。モーショングラフデータは、モーショングラフが有するノード(ビートフレーム)の情報と、ノード間のエッジ(双方向エッジまたは単方向エッジ)の情報(エッジの重みを含む)と、双方向エッジに対応する2方向分のブレンディング動きデータと、ノードのウェートとを有する。 Through the above-described motion graph construction step, motion graph data of a certain genre tempo database (tempo iDB) is generated. The motion graph data includes information on nodes (beat frames) included in the motion graph, information on edges between nodes (bidirectional edges or unidirectional edges) (including edge weights), and two directions corresponding to bidirectional edges. Minute blending motion data and node weights.
モーショングラフ生成部35は、各ジャンルのテンポデータベースごとに生成したモーショングラフデータをデータベース12に格納する。これにより、データベース12には、各ジャンルのテンポデータベースごとに、モーショングラフデータが格納される。
The motion
以上がメタデータ構築装置10に係る説明である。メタデータ構築装置10の処理はオフラインで実行され、データベース12が構築される。このデータベース12を用いて、映像コンテンツ生成装置20のオンライン処理が行われる。以下、映像コンテンツ生成装置20のオンライン処理を説明する。
This completes the description of the
映像コンテンツ生成装置20は、ストリーミング方式で配信される映像コンテンツ生成対象の楽曲の音楽データに同期した映像データを生成し、音楽データと映像データとを再生する。図14は、ストリーミング方式で配信される音楽データと、生成した映像データの流れを示した概念図である。映像コンテンツ生成装置20は、ストリーミング方式で配信される音楽データを音楽データ記憶部21(back-buffer)に蓄積する。そして、映像コンテンツ生成装置20は、一定時間(例えば、10秒間)再生分の音楽データを音楽データ記憶部21(back-buffer)に蓄積した場合、この音楽データに同期した映像データを生成し、この音楽データと、生成した映像データとを映像コンテンツ記憶部28(front-buffer)に記憶する(同期処理を行う)。そして、映像コンテンツ生成装置20は、映像コンテンツ記憶部28(front-buffer)が記憶する音楽データと映像データとを再生しながら、再度一定時間再生分の音楽データを音楽データ記憶部21(back-buffer)に蓄積した場合、この音楽データに対する同期処理を行う。
The video
このように、映像コンテンツ生成装置20は、音楽データと映像データとを再生しつつ、音楽データの配信が完了するまで、音楽データを一定時間再生分蓄積した場合に同期処理を行う。従って、一曲分の音楽データの配信が完了するまで待機することなく、音楽データと、この音楽データに同期した映像データとを再生することができる。
As described above, the video
また、同期処理の処理時間が一定時間再生分の「一定時間」よりも短い場合には、最初に同期処理を行った後、待ち時間なく(リアルタイムで)音楽データと映像データとを再生することができる。 In addition, if the processing time of the synchronization process is shorter than the “certain time” for a certain period of time, the music data and the video data should be reproduced without waiting time (in real time) after performing the synchronization process first. Can do.
図15は、同期処理の処理時間と、同期処理により生成した映像コンテンツ(音楽データと、この音楽データに同期した映像データ)の再生時間との関係を示した概略図である。図示する例では、同期処理の処理時間として領域1501〜1503が示されており、同期処理により生成した映像コンテンツの再生時間として領域1504〜1506が示されている。コンテンツ生成装置20は、領域1501の時間において同期処理により生成した映像コンテンツを領域1504の時間において再生する。また、コンテンツ生成装置20は、領域1504の時間において映像コンテンツを再生しつつ、領域1502の時間において、同期処理により映像コンテンツを生成する。そして、コンテンツ生成装置20は、領域1502の時間において同期処理により生成した映像コンテンツを領域1505の時間において再生する。以下、音楽データのストリーミング方式による配信が完了するまで、映像コンテンツ生成装置20は、同様に同期処理と再生とを行う。
FIG. 15 is a schematic diagram showing the relationship between the processing time of the synchronization processing and the playback time of video content (music data and video data synchronized with the music data) generated by the synchronization processing. In the illustrated example,
なお、映像コンテンツの再生時間よりも同期処理の処理時間の方が短い場合、図15に示したように同期処理を行う間(例えば、領域1501と領域1502との間や、領域1502と領域1503との間)に待ち時間が発生するため、映像コンテンツの再生時間に合わせて「一定時間」を変動させるようにしてもよい。
Note that if the processing time of the synchronization processing is shorter than the playback time of the video content, during the synchronization processing as shown in FIG. 15 (for example, between the
図16は、「一定時間」を変動させた場合における、同期処理の処理時間と、同期処理により生成した映像コンテンツ(音楽データと、この音楽データに同期した映像データ)の再生時間との関係を示した概略図である。図示する例では、同期処理の処理時間として領域1601〜1603が示されており、同期処理により生成した映像コンテンツの再生時間として領域1604〜1606が示されている。コンテンツ生成装置20は、領域1601の時間において同期処理により生成した映像コンテンツを領域1604の時間において再生している。また、コンテンツ生成装置20は、領域1604の時間において映像コンテンツを再生しつつ、領域1602の時間において、同期処理により映像コンテンツを生成している。このように、同期処理を行う領域1602の時間を、映像コンテンツを再生する領域1604の時間と同じ時間となるように、「一定時間」を長くすることで、同期処理を行う間(例えば、領域1601と領域1602との間や、領域1602と領域1603との間)の待ち時間が無くなる。また、「一定時間」を長くすることで、同期処理によって生成される映像コンテンツの長さも長くなる。図示する例では領域1604よりも領域1605の方が長く、また、領域1605よりも領域1606の方が長い。
FIG. 16 shows the relationship between the processing time of the synchronization process and the playback time of the video content (music data and video data synchronized with this music data) generated by the synchronization process when the “certain time” is varied. It is the shown schematic. In the illustrated example,
以下、図1に示される映像コンテンツ生成システム1に含まれる映像コンテンツ生成装置20の各部について順次説明する。
Hereinafter, each part of the video
[音楽データ記憶部]
映像コンテンツ生成装置20には、映像コンテンツ生成対象の楽曲の音楽データが、ストリーミング方式で楽曲ファイル3から配信(入力)される。音楽データ記憶部21は、ストリーミング方式で配信される音楽データを蓄積(記憶)する。
[Music data storage]
The video
[音楽解析部]
音楽解析部22は、音楽データ記憶部21が一定時間再生分の音楽データを記憶した場合、この音楽データを音楽データ記憶部21から読み出して解析することにより音楽特徴量を取得する。本実施形態では、非特許文献2に記載の技術を用いて、一定時間再生分の音楽データから、ビート間隔及びビート時刻を取得する。また、本実施形態では(25)式により、一定時間再生分の音楽データの盛り上がりを算出する。
[Music Analysis Department]
When the music
但し、s(I,j)は楽曲の第j channelの第i個信号であり、N(k)は第k segmentの楽曲信号の数であり、Wは固定長さ(例えば、2)であり、I(k)は第k segmentの盛り上がりである。 However, s (I, j) is the i-th signal of the j-th channel of the music, N (k) is the number of music signals of the k-th segment, and W is a fixed length (for example, 2). , I (k) is the rise of the k-th segment.
さらに、音楽解析部22は、(26)式により、音楽のテンポを算出する。音楽のテンポは、1分間当たりのビートの個数である。
Further, the
但し、TBmusicはビート間隔(秒)である。
音楽解析部22は、一定時間再生分の音楽データのビート間隔、ビート時刻、テンポおよび盛り上がりを音楽特徴量として音楽解析データ記憶部212に格納する。また、音楽解析部22は、一定時間再生分の音楽データを映像コンテンツ記憶部28に格納する。
Where TB music is the beat interval (seconds).
The
[最適パス探索部]
まず、最適パス探索部24は、メタデータ構築装置10が有するデータベース12内のモーショングラフデータの中から、映像コンテンツ生成対象の楽曲に合ったモーショングラフデータを選択する。この選択では、映像コンテンツ生成対象の楽曲に合ったジャンルのモーショングラフデータの中から、映像コンテンツ生成対象の楽曲のテンポに合ったモーショングラフデータを選択する。映像コンテンツ生成対象の楽曲に合ったジャンルは、利用者から入力してもらう、又は予め設定しておく。
[Optimum path search unit]
First, the optimal
具体的には、最適パス探索部24は、音楽解析部22が解析した音楽のテンポと該選択したジャンルのモーショングラフデータの中で最小のテンポを上記(18)式にあてはめて計算を行う。次いで、最適パス探索部24は、利用者から入力された又は予め設定されたジャンルのモーショングラフデータの中から、その(18)式の算出値iに対応するモーショングラフデータを選択する。
Specifically, the optimum
次いで、最適パス探索部24は、選択したモーショングラフデータと、音楽解析部22が解析した(音楽解析データ記憶部23が記憶する)音楽特徴量とを用いて、モーショングラフのノードを連結する最適なパスを探索する。以下、最適パスの探索方法を説明する。
Next, the optimal
[始点選択ステップ]
始点選択ステップでは、モーショングラフ内のノードから、映像コンテンツの動きの始点となるノードの候補(始点候補ノード)を選択する。始点候補ノードには、モーショングラフ内のノードであって、各動きデータの最初のビートフレームに対応するノードを全て抽出する。従って、始点候補ノードは、通常、複数ある。
[Start point selection step]
In the start point selection step, a node candidate (start point candidate node) that is the start point of the motion of the video content is selected from the nodes in the motion graph. As the start point candidate nodes, all the nodes in the motion graph corresponding to the first beat frame of each motion data are extracted. Therefore, there are usually a plurality of start point candidate nodes.
[最適パス探索ステップ]
次いで、最適パス探索ステップでは、モーショングラフ上の始点候補ノードからの最適パスを始点候補ノード毎に探索し、各始点候補ノードに係る最適パスの中から最小コストのパスを選択する。このパス探索方法には、非特許文献5に記載されるパス探索技術を用いる。非特許文献5に記載されるパス探索技術は、ある始点からダイナミックプログラミングで最適なパスを探索するものである。以下、最適パス探索ステップの詳細を説明する。
[Optimum path search step]
Next, in the optimum path search step, the optimum path from the start point candidate node on the motion graph is searched for each start point candidate node, and the path with the lowest cost is selected from among the optimum paths related to each start point candidate node. For this path search method, the path search technique described in
まず、ある始点候補ノードuからモーショングラフ上の全てのノードiまでの各パスのコストを(27)式により初期化する。この操作を第0回の最短パス算出操作と呼ぶ。 First, the cost of each path from a certain starting point candidate node u to all the nodes i on the motion graph is initialized by equation (27). This operation is called the 0th shortest path calculation operation.
但し、InitSは複数の始点の集合である。 However, InitS is a set of a plurality of starting points.
次いで、第1回目以降の第k回の最短パス算出操作では、(28)式により、始点候補ノードuからモーショングラフ上の全てのノードvまでの最適パスのコストを算出する。 Next, in the k-th shortest path calculation operation after the first time, the cost of the optimal path from the starting point candidate node u to all the nodes v on the motion graph is calculated by the equation (28).
但し、Vはモーショングラフ上のノードの集合である。shortestPath(v,k)は、第k回の最短パス算出操作による、始点候補ノードuからノードvまでの最適パスのコストである。edgeCost(i,v)はノードiからノードvまでのエッジコストである。エッジコストの計算式は(30)式である。 V is a set of nodes on the motion graph. shorttestPath (v, k) is the cost of the optimum path from the starting point candidate node u to the node v by the k-th shortest path calculation operation. edgeCost (i, v) is the edge cost from node i to node v. The formula for calculating the edge cost is (30).
この(28)式を用いた第1回目以降の最短パス算出操作は、第K回まで繰り返し行う。但し、Kは映像コンテンツ生成対象である一定時間再生分の音楽データに含まれるビート数である。一定時間再生分の音楽データに含まれるビート数Kは、一定時間再生分の音楽データのビート時刻の総数に等しい。一定時間再生分の音楽データのビート時刻は、音楽解析データ記憶部212に格納されているので、その格納数を数えることによってビート数Kを求めることができる。 The first and subsequent shortest path calculation operations using equation (28) are repeated until the Kth time. Here, K is the number of beats included in music data for a certain period of time that is a video content generation target. The number of beats K included in music data for a certain period of time is equal to the total number of beat times of music data for a certain period of time. Since the beat time of music data for a certain period of time is stored in the music analysis data storage unit 212, the beat number K can be obtained by counting the stored number.
上記(27)式および(28)式を用いた最短パス算出操作を、全ての始点候補ノードに対してそれぞれに行う。次いで、全ての始点候補ノードに係る第K回の最短パス算出操作結果から、(29)式により、最小コストのパスを選択する。 The shortest path calculation operation using the above equations (27) and (28) is performed on all the start point candidate nodes. Next, the path with the minimum cost is selected from the results of the K-th shortest path calculation operation related to all the start point candidate nodes according to the equation (29).
shortestPath(v,K)は、第K回の最短パス算出操作による、始点候補ノードuからノードvまでの最適パスのコストである。shortestPath(K)は、最小コストのパス(始点ノードuから終点ノードvまでのパス)のコストである。 shorttestPath (v, K) is the cost of the optimum path from the starting point candidate node u to the node v by the Kth shortest path calculation operation. shorttestPath (K) is the cost of the path with the lowest cost (path from the start node u to the end node v).
但し、THは音楽が終了するまでのビート数である。THの推定方法としては、例えば、1秒間に含まれるビート数を算出し、音楽が終了するまでの残り時間(終了までの音楽の長さ)を、1秒間に含まれるビート数で割ることで推定する方法がある。なお、音楽が終了するまでのビート数(音楽の長さ)が分からなければ、THを無限大に設定する。 Here, TH is the number of beats until the music ends. As an estimation method of TH, for example, the number of beats included in one second is calculated, and the remaining time until the music ends (the length of music until the end) is divided by the number of beats included in one second. There is a way to estimate. If the number of beats until the music ends (the length of the music) is not known, TH is set to infinity.
(29)式より、最小コストのパスに含まれるノードのウェートw(v)は、音楽が終了されるまでのビート数以上である条件(条件w(v)>=TH)を満たすので、音楽の途中で動きデータの連続性が途切れることが無くなる。例えば、音楽が終了するまでのビート数THが不明の場合、最小コストのパスに含まれるノードのウェートは、常に無限大である。 From equation (29), the weight w (v) of the node included in the path with the lowest cost satisfies the condition (condition w (v)> = TH) that is equal to or greater than the number of beats until the music is completed. The continuity of motion data is not interrupted during the process. For example, when the number of beats TH until the end of music is unknown, the weight of the node included in the path with the lowest cost is always infinite.
エッジコストは、(30)式により、毎回計算される。 The edge cost is calculated every time using equation (30).
最適パス探索ステップでは、上記(29)式によって選択された最小コストのパスを探索結果の最適パスとする。この最適パスに含まれるK個のノードは、1個の始点ノードuと、(K−2)個の経由ノードiと、1個の終点ノードvである。ここで、始点候補ノードは、通常、複数あるので、上記探索結果の最適パスは始点候補ノードの数と同じ数だけある。それら最適パスの中から、コストが一番小さいパスとその始点を最終結果の最適パスとして選択する。この最終結果の最適パスに含まれるK個のノードは、1個の最適始点ノードuoptと、(K−2)個の経由ノードioptと、1個の終点ノードvoptである。 In the optimum path search step, the path with the minimum cost selected by the above equation (29) is set as the optimum path of the search result. The K nodes included in the optimum path are one start node u, (K−2) transit nodes i, and one end node v. Here, since there are usually a plurality of start point candidate nodes, there are as many optimal paths as the search results as the number of start point candidate nodes. From these optimum paths, the path with the lowest cost and its starting point are selected as the optimum path of the final result. The K nodes included in the optimal path of the final result are one optimal start point node u opt , (K−2) via nodes i opt , and one end point node v opt .
[同期部]
同期部25は、最適パス探索部24が探索した最適パスに従って、動きデータと音楽データを対応付ける同期情報を生成する。以下、同期情報生成方法の詳細を説明する。
[Synchronization part]
The
まず、最適パス探索部24が探索した最適パスに含まれるK個のノード(1個の始点ノードuoptと、(K−2)個の経由ノードioptと、1個の終点ノードvopt)に対応するK個のビートフレーム(1個の始点ビートフレームと、(K−2)個の経由ビートフレームと、1個の終点ビートフレーム)について、最適パスの順番で隣り合うビートフレーム間の時間を求める。さらに、各隣接ビートフレーム間のフレームレートを求める。また、映像コンテンツ生成対象の楽曲のK個のビートについて、時間的に隣り合うビート間の時間を求める。 First, K nodes included in the optimum path searched by the optimum path search unit 24 (one start point node u opt , (K−2) transit nodes i opt , and one end point node v opt ). Time between adjacent beat frames in the optimal path order for K beat frames (one start beat frame, (K-2) via beat frames, and one end beat frame) corresponding to Ask for. Further, the frame rate between each adjacent beat frame is obtained. In addition, the time between beats that are temporally adjacent to each other is obtained for K beats of the music for which video content is to be generated.
次いで、楽曲のビート間隔に動きのビート間隔を等しくするように、(31)式により、動きのフレームレートを増減させる調整を行う。図17に、動きのフレームレートを調整する処理の概念図を示す。(31)式は、n番目のビートフレームと(n+1)番目のビートフレームの間のフレームレートを算出するための計算式である(但し、nは1から(K−1)までの自然数である)。 Next, an adjustment to increase / decrease the frame rate of motion is performed using equation (31) so that the beat interval of motion is equal to the beat interval of music. FIG. 17 shows a conceptual diagram of processing for adjusting the frame rate of motion. Expression (31) is a calculation expression for calculating a frame rate between the nth beat frame and the (n + 1) th beat frame (where n is a natural number from 1 to (K−1)). ).
但し、tmotion node2は隣接ビートフレームのうち先のビートフレームの時刻、tmotion node1は該隣接ビートフレームのうち後のビートフレームの時刻である。tmusic node2は楽曲の隣接ビートのうち先のビートの時刻、tmusic node1は該隣接ビートのうち後のビートの時刻である。rate_oldは元のフレームレートである。rate_newは調整後のフレームレートである。 However, t motion node2 the time of the beat frame among target adjacent beat frames, t motion node1 is the time of the beat frame after out of the adjacent beat frames. t music node 2 is the time of the previous beat of the adjacent beats of the music , and t music node 1 is the time of the later beat of the adjacent beats. rate_old is the original frame rate. rate_new is the adjusted frame rate.
同期部25は、上記した同期情報生成方法によって、映像コンテンツの動きの始点となる1個の始点ビートフレームと、映像コンテンツの動きの終点となる1個の終点ビートフレームと、始点ビートフレームから終点ビートフレームに至るまでに経由する(K−2)個の経由ビートフレームと、各隣接ビートフレーム間の調整後のフレームレートとを得る。同期部25は、始点ビートフレームの情報と経由ビートフレームの情報と終点ビートフレームの情報と調整後のフレームレートの情報と該ビートフレーム間のブレンディング動きデータを同期情報として同期情報記憶部26に格納する。なお、ブレンディング動きデータは、最適パス探索部24の探索結果の最適パスに沿った方向のデータのみでよい。
The
[映像データ生成部]
映像データ生成部27は、同期情報記憶部26に格納された同期情報に基づいて、映像コンテンツ生成対象の楽曲の音楽データとともに再生される映像データを生成する。具体的には、始点ビートフレームから経由ビートフレームを経由して終点ビートフレームに至るまでに必要な動きデータを動きデータベース2から取得する。
[Video data generator]
Based on the synchronization information stored in the synchronization
次いで、取得した動きデータ間を連結する部分(双方向エッジに対応する部分)に対してブレンディング動きデータで置換する。このとき、動きデータの連結部分において、動きデータのルート座標と方向の平行移動を行う。動きデータが連結される際に各動きデータのルート座標は、各動きデータに独自のローカル座標のままである。このままでは、連結後の動きデータの再生画像は、ルート座標が整合されていないために、スムーズな動きにならない。このため、動きデータの連結部分において、後の動きデータのルート座標を前の動きデータの最後のフレームで表現している位置へオフセットする。これにより、動きデータの連結部分における補間処理を行い、連結後の動きデータの再生画像がスムーズな動きとなるようにする。同様に、動きデータが連結される際に各動きデータのルート方向は、後の動きデータのルート方向を前の動きデータの最後のフレームで表現している方向へオフセットする。 Next, a portion connecting the acquired motion data (a portion corresponding to a bidirectional edge) is replaced with blending motion data. At this time, the movement data is translated in the direction and the root coordinate of the movement data at the connection portion of the movement data. When motion data is connected, the root coordinates of each motion data remain as local coordinates unique to each motion data. In this state, the reproduced image of the motion data after connection does not move smoothly because the root coordinates are not matched. For this reason, the root coordinate of the subsequent motion data is offset to the position represented by the last frame of the previous motion data in the connection portion of the motion data. As a result, the interpolation processing is performed at the connection portion of the motion data so that the reproduced image of the motion data after the connection has a smooth motion. Similarly, when motion data is connected, the root direction of each motion data is offset to the direction expressed by the last frame of the previous motion data.
次いで、連結された動きデータに対して、各隣接ビートフレーム間の調整後のフレームレートの情報を付加する。映像データ生成部27は、この生成した映像データを、既に格納されている一定時間再生分の音楽データに関連付けて、映像コンテンツ記憶部28に格納する。
Next, the adjusted frame rate information between adjacent beat frames is added to the connected motion data. The video
[再生部]
再生部29は、映像コンテンツ記憶部28に関連付けて格納された映像データと、映像コンテンツ生成対象の楽曲の一定時間再生分の音楽データとを、ともに再生する。このとき、再生部29は、映像データに付加されたフレームレートの情報に従って、隣接ビートフレーム間のフレームレートを設定する。これにより、映像データと音楽データは、互いのビートが同期して再生される。なお、再生部29は、映像コンテンツ生成装置20とは独立した装置であってもよい。
[Playback section]
The
なお、上述した例では、映像コンテンツ生成装置20は、一定時間再生分の音楽データ毎に、順次同期処理を行う例を示したが、これに限らない。例えば、図18に示すように、同期処理を行う時間間隔を短くして、同じ再生部分を含む音楽データについて同期処理を行うようにしてもよい。
In the above-described example, the video
図18は、同期処理の対象となる一定時間再生分の音楽データと、同期処理により選択されたパスとの関係を示した概略図である。図示する例では、時刻aにおいて、ストリーミング配信された一定時間再生分の音楽データの再生部分の時間として領域1801が示されている。また、時刻bにおいて、ストリーミング配信された一定時間再生分の音楽データの再生部分の時間として領域1802が示されている。また、時刻cにおいて、ストリーミング配信された一定時間再生分の音楽データの再生部分の時間として領域1801が示されている。また、時刻aにおいて、ストリーミング配信された一定時間再生分の音楽データに基づいた同期処理により選択したパス1804が示されている。また、時刻bにおいて、ストリーミング配信された一定時間再生分の音楽データに基づいた同期処理により選択したパス1805が示されている。
FIG. 18 is a schematic diagram showing the relationship between music data for a certain period of time to be synchronized and the path selected by the synchronization. In the example shown in the drawing, an
本実施形態では、音楽データはストリーミング方式により配信される。そのため、同期処理を行う時間間隔を短くすることで、新たに配信された音楽データに基づいてパスを選択することができるため、より関連性が高い映像データを生成するためのパスを選択することができる。 In this embodiment, music data is distributed by a streaming method. Therefore, by shortening the time interval for performing the synchronization process, it is possible to select a path based on newly distributed music data, so it is possible to select a path for generating more relevant video data Can do.
なお、本実施形態に係るメタデータ構築装置10および映像コンテンツ生成装置20は、専用のハードウェアにより実現されるものであってもよく、あるいはパーソナルコンピュータ等のコンピュータシステムにより構成され、図1に示されるメタデータ構築装置10および映像コンテンツ生成装置20の各部の機能を実現するためのプログラムを実行することによりその機能を実現させるものであってもよい。
Note that the
また、そのメタデータ構築装置10および映像コンテンツ生成装置20には、周辺機器として入力装置、表示装置等が接続されるものとする。ここで、入力装置とはキーボード、マウス等の入力デバイスのことをいう。表示装置とはCRT(Cathode Ray Tube)や液晶表示装置等のことをいう。
また、上記周辺機器については、メタデータ構築装置10および映像コンテンツ生成装置20に直接接続するものであってもよく、あるいは通信回線を介して接続するようにしてもよい。
In addition, an input device, a display device, and the like are connected to the
The peripheral device may be directly connected to the
また、図1に示すメタデータ構築装置10および映像コンテンツ生成装置20が行う各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、映像コンテンツ生成処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、DVD(Digital Versatile Disk)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
Also, a program for realizing each step performed by the
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
“Computer-readable recording medium” refers to a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a DVD (Digital Versatile Disk), and a built-in computer system. A storage device such as a hard disk.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
例えば、携帯端末が、メタデータ構築装置10の各部と、映像コンテンツ生成装置20の各部とを備える構成としてもよい。また、メタデータ構築装置10の各部と、映像コンテンツ生成装置20の各部と、映像コンテンツ記憶部28に記憶されている音楽データと映像データとを携帯端末などの他の装置に配信する配信部とを備えた映像コンテンツ配信装置として構成してもよい。
また、上述した実施形態では人の動きデータを扱ったが、本発明は各種の物体の動きデータに適用することができる。ここで、物体とは、人、動物、植物その他の生物、及び、生物以外の物(ロボット等)を含む。
As mentioned above, although embodiment of this invention was explained in full detail with reference to drawings, the specific structure is not restricted to this embodiment, The design change etc. of the range which does not deviate from the summary of this invention are included.
For example, the mobile terminal may be configured to include each unit of the
In the above-described embodiment, human motion data is handled. However, the present invention can be applied to motion data of various objects. Here, the object includes people, animals, plants and other living things, and things other than living things (robots and the like).
また、本発明は、3次元コンテンツの生成に利用することができる。 The present invention can also be used for generating three-dimensional content.
1・・・映像コンテンツ生成システム、2・・・動きデータベース、3・・・楽曲ファイル、10・・・メタデータ構築装置、11・・・動き解析部、12・・・データベース、20・・・映像コンテンツ生成装置、21・・・音楽データ記憶部、22・・・音楽解析部、23・・・音楽解析データ記憶部、24・・・最適パス探索部、25・・・同期部、26・・・同期情報記憶部、27・・・映像データ生成部、28・・・映像コンテンツ記憶部、29・・・再生部、31・・・ビート抽出部、32・・・ビート情報記憶部、33・・・盛り上がり算出部、34・・・盛り上がり情報記憶部、35・・・モーショングラフ生成部、311・・・物理量変換部、312・・・データ分割部、313・・・短時間主成分分析部、314・・・主成分座標連結部、315・・・ビート推定部、316・・・後処理部
DESCRIPTION OF
Claims (17)
前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、
映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、
前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、
前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、
前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、
を備え、
前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、
前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索する
ことを特徴とする映像コンテンツ生成システム。 A motion graph construction unit that constructs a motion graph including nodes, edges, and edge weights based on feature quantities extracted from motion capture data applicable to video content;
A metadata construction unit for calculating metadata indicating the possibility of synchronization with music in each node of the motion graph;
A music analysis unit that inputs music data of a video content generation target song by a predetermined amount in a playback order and acquires music feature values from the input music data of the predetermined amount;
On the motion graph, among nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data, a path in which the final node of the node group has a certain synchronization possibility can be connected. An optimal path search unit to search;
A synchronization unit that generates synchronization information that associates the motion data corresponding to the path searched by the optimal path search unit with the predetermined amount of music data;
A video data generating unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information;
Equipped with a,
The metadata construction unit generates a motion graph including a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to the video content, and an edge indicating connectivity of the node. For each included node, there is a weight calculation means for calculating a weight according to the number of nodes that can be connected after the node,
The optimum path search unit searches for the path based on the weight calculated by the weight calculation unit.
The video content generation system which is characterized a call.
ことを特徴とする請求項1に記載の映像コンテンツ生成システム。 The weight calculating means calculates a node in which the number of nodes that can be connected after the node is zero and a node in which the number of nodes that can be connected after the node is infinite. The video content generation system according to claim 1 , wherein a weight of another node is estimated from the node.
ことを特徴とする請求項1または請求項2に記載の映像コンテンツ生成システム。 The optimal path search unit is a path connecting nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph, and the weight of the last node is a certain amount or more. video content generation system according to claim 1 or claim 2, characterized in that searching for a path is.
ことを特徴とする請求項1または請求項2に記載の映像コンテンツ生成システム。 The optimal path search unit is a path connecting nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph, and determines only a part of the head. The video content generation system according to claim 1 or 2 , wherein:
ことを特徴とする請求項1から請求項4のいずれか1項に記載の映像コンテンツ生成システム。 The video according to any one of claims 1 to 4 , wherein the music analysis unit determines a predetermined amount of music data according to a calculation time of the optimum path search unit and a music data rate. Content generation system.
を備え、
前記音楽解析部は、次処理で用いる前記音楽データの所定量を、前記記憶部の最大記憶容量またはユーザによる記憶量の指定のうち少ない方のデータ量であって、今回の処理で前記映像データ生成部が生成した映像データの再生時間内に処理可能なデータ量とすることを特徴とする請求項5に記載の映像コンテンツ生成システム。 A storage unit for storing the music data of the input video content generation target music;
The music analysis unit has a predetermined amount of the music data used in the next processing, which is a smaller data amount of the maximum storage capacity of the storage unit or the storage amount specified by the user, and the video data 6. The video content generation system according to claim 5 , wherein a data amount that can be processed within a reproduction time of the video data generated by the generation unit is set.
を有することを特徴とするメタデータ構築装置。 For each node included in a motion graph composed of a frame node having the same motion feature amount among the feature amounts extracted from motion capture data applicable to video content and an edge indicating connectivity of the node, the node A metadata construction apparatus comprising weight calculation means for calculating a weight in accordance with the number of nodes that can be connected after.
ことを特徴とする請求項7に記載のメタデータ構築装置。 The weight calculating means calculates a node in which the number of nodes that can be connected after the node is zero and a node in which the number of nodes that can be connected after the node is infinite. The metadata construction apparatus according to claim 7 , wherein a weight of another node is estimated from the node.
映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、
前記モーショングラフ上で、前記ウェートに基づいて前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスを探索する最適パス探索部と、
前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、
前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、
を備えたことを特徴とする映像コンテンツ生成装置。 A motion graph composed of a frame node having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content, and an edge indicating connectivity of the node, and a node included in the motion graph An acquisition unit that acquires a weight according to the number of nodes that can be connected after the node,
A music analysis unit that inputs music data of a video content generation target song by a predetermined amount in a playback order and acquires music feature values from the input music data of the predetermined amount;
On the motion graph, an optimal path search unit that searches for a path connecting nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data based on the weights;
A synchronization unit that generates synchronization information that associates the motion data corresponding to the path searched by the optimal path search unit with the predetermined amount of music data;
A video data generating unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information;
A video content generation apparatus comprising:
ことを特徴とする請求項9に記載の映像コンテンツ生成装置。 The optimal path search unit is a path connecting nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph, and the weight of the last node is a certain amount or more. The video content generation device according to claim 9 , wherein a path that is is searched.
ことを特徴とする請求項9に記載の映像コンテンツ生成装置。 The optimal path search unit is a path connecting nodes having motion feature amounts corresponding to music feature amounts of the predetermined amount of music data on the motion graph, and determines only a part of the head. The video content generation device according to claim 9 .
ことを特徴とする請求項9から請求項11のいずれか1項に記載の映像コンテンツ生成装置。 The said music analysis part determines the predetermined amount of music data by the calculation time of the said optimal path | pass search part, and the data rate of music. The one of Claim 9 to 11 characterized by the above-mentioned. Video content generation device.
を備え、
前記音楽解析部は、次処理で用いる前記音楽データの所定量を、前記記憶部の最大記憶容量またはユーザによる記憶量の指定のうち少ない方のデータ量であって、今回の処理で前記映像データ生成部が生成した映像データの再生時間内に処理可能なデータ量とすることを特徴とする請求項12に記載の映像コンテンツ生成装置。 A storage unit for storing the music data of the input video content generation target music;
The music analysis unit has a predetermined amount of the music data used in the next processing, which is a smaller data amount of the maximum storage capacity of the storage unit or the storage amount specified by the user, and the video data 13. The video content generation apparatus according to claim 12 , wherein the video content generation apparatus has a data amount that can be processed within a reproduction time of the video data generated by the generation unit.
前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、
映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、
前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、
前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、
前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、
を備え、
前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、
前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索する
ことを特徴とする携帯端末。 A motion graph construction unit that constructs a motion graph including nodes, edges, and edge weights based on feature quantities extracted from motion capture data applicable to video content;
A metadata construction unit for calculating metadata indicating the possibility of synchronization with music in each node of the motion graph;
A music analysis unit that inputs music data of a video content generation target song by a predetermined amount in a playback order and acquires music feature values from the input music data of the predetermined amount;
On the motion graph, among nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data, a path in which the final node of the node group has a certain synchronization possibility can be connected. An optimal path search unit to search;
A synchronization unit that generates synchronization information that associates the motion data corresponding to the path searched by the optimal path search unit with the predetermined amount of music data;
A video data generating unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information;
Equipped with a,
The metadata construction unit generates a motion graph including a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to the video content, and an edge indicating connectivity of the node. For each included node, there is a weight calculation means for calculating a weight according to the number of nodes that can be connected after the node,
The optimum path search unit searches for the path based on the weight calculated by the weight calculation unit.
Mobile terminal, wherein a call.
前記モーショングラフの各ノードにおいて楽曲との同期可能性を示すメタデータを算出するメタデータ構築部と、
映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析部と、
前記モーショングラフ上で、前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群の中で該ノード群の最終ノードが一定の同期可能性を有するノード群を連結できるパスとして探索する最適パス探索部と、
前記最適パス探索部が探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期部と、
前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成部と、
前記所定量の音楽データと、当該所定量の音楽データとともに再生される映像データとを配信する配信部と、
を備え、
前記メタデータ構築部は、前記映像コンテンツに適用可能なモーションキャプチャデータから抽出した特徴量のうち同じ動き特徴量を有するフレームのノードと当該ノードの連結性を示すエッジとから構成されるモーショングラフに含まれるノード毎に、当該ノードの後に連結することができるノード数に応じたウェートを算出するウェート算出手段を有し、
前記最適パス探索部は、前記ウェート算出手段が算出した前記ウェートに基づいて前記パスを探索する
ことを特徴とする映像コンテンツ配信装置。 A motion graph construction unit that constructs a motion graph including nodes, edges, and edge weights based on feature quantities extracted from motion capture data applicable to video content;
A metadata construction unit for calculating metadata indicating the possibility of synchronization with music in each node of the motion graph;
A music analysis unit that inputs music data of a video content generation target song by a predetermined amount in a playback order and acquires music feature values from the input music data of the predetermined amount;
On the motion graph, among nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data, a path in which the final node of the node group has a certain synchronization possibility can be connected. An optimal path search unit to search;
A synchronization unit that generates synchronization information that associates the motion data corresponding to the path searched by the optimal path search unit with the predetermined amount of music data;
A video data generating unit that generates video data to be reproduced together with the predetermined amount of music data based on the synchronization information;
A distribution unit that distributes the predetermined amount of music data and video data reproduced together with the predetermined amount of music data;
Equipped with a,
The metadata construction unit generates a motion graph including a node of a frame having the same motion feature amount among feature amounts extracted from motion capture data applicable to the video content, and an edge indicating connectivity of the node. For each included node, there is a weight calculation means for calculating a weight according to the number of nodes that can be connected after the node,
The optimum path search unit searches for the path based on the weight calculated by the weight calculation unit.
The video content delivery device comprising a call.
をコンピュータに実行させるためのコンピュータプログラム。 For each node included in a motion graph composed of a frame node having the same motion feature amount among the feature amounts extracted from motion capture data applicable to video content and an edge indicating connectivity of the node, the node A computer program for causing a computer to execute a weight calculation step of calculating a weight according to the number of nodes that can be connected after the.
映像コンテンツ生成対象楽曲の音楽データが再生順に所定量ずつ入力され、入力された当該所定量の音楽データから音楽特徴量を取得する音楽解析ステップと、
前記モーショングラフ上で、前記ウェートに基づいて前記所定量の音楽データの音楽特徴量に対応する動き特徴量を有するノード群を連結するパスを探索する最適パス探索ステップと、
前記最適パス探索ステップで探索した前記パスに応じた前記動きデータと前記所定量の音楽データとを対応付ける同期情報を生成する同期ステップと、
前記同期情報に基づいて、前記所定量の音楽データとともに再生される映像データを生成する映像データ生成ステップと、
をコンピュータに実行させるためのコンピュータプログラム。 A motion graph composed of a frame node having the same motion feature amount among feature amounts extracted from motion capture data applicable to video content, and an edge indicating connectivity of the node, and a node included in the motion graph An acquisition step of acquiring a weight according to the number of nodes that can be linked after the node;
A music analysis step of inputting music data of the video content generation target music piece by a predetermined amount in a playback order and obtaining a music feature amount from the input music data of the predetermined amount;
On the motion graph, an optimal path search step of searching for a path connecting nodes having a motion feature amount corresponding to the music feature amount of the predetermined amount of music data based on the weight;
A synchronization step of generating synchronization information that associates the motion data corresponding to the path searched in the optimal path search step with the predetermined amount of music data;
A video data generating step for generating video data to be reproduced together with the predetermined amount of music data based on the synchronization information;
A computer program for causing a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010072247A JP5372823B2 (en) | 2010-03-26 | 2010-03-26 | Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010072247A JP5372823B2 (en) | 2010-03-26 | 2010-03-26 | Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011204113A JP2011204113A (en) | 2011-10-13 |
JP5372823B2 true JP5372823B2 (en) | 2013-12-18 |
Family
ID=44880675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010072247A Expired - Fee Related JP5372823B2 (en) | 2010-03-26 | 2010-03-26 | Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5372823B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109068081A (en) * | 2018-08-10 | 2018-12-21 | 北京微播视界科技有限公司 | Video generation method, device, electronic equipment and storage medium |
CN113160848B (en) * | 2021-05-07 | 2024-06-04 | 网易(杭州)网络有限公司 | Dance animation generation method, model training method, device, equipment and storage medium |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3431452B2 (en) * | 1997-06-16 | 2003-07-28 | 株式会社東芝 | Animation creation device and animation creation method |
JP2004127019A (en) * | 2002-10-03 | 2004-04-22 | Sony Corp | Information processing system, method and program for controlling graphic display |
JP4128431B2 (en) * | 2002-11-27 | 2008-07-30 | 富士通株式会社 | Directed graph analysis method, analysis apparatus and program thereof |
JP2005056101A (en) * | 2003-08-04 | 2005-03-03 | Matsushita Electric Ind Co Ltd | Cg animation device linked with music data |
JP2007018388A (en) * | 2005-07-08 | 2007-01-25 | Univ Of Tokyo | Forming apparatus and method for creating motion, and program used therefor |
JP5055223B2 (en) * | 2008-08-11 | 2012-10-24 | Kddi株式会社 | Video content generation apparatus and computer program |
-
2010
- 2010-03-26 JP JP2010072247A patent/JP5372823B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011204113A (en) | 2011-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5554677B2 (en) | VIDEO CONTENT GENERATION SYSTEM, VIDEO CONTENT GENERATION DEVICE, AND COMPUTER PROGRAM | |
JP5238602B2 (en) | Video content generation apparatus and computer program | |
JP7209333B2 (en) | Joint position acquisition method and device, movement acquisition method and device | |
JP5055223B2 (en) | Video content generation apparatus and computer program | |
JP5604225B2 (en) | Human body posture estimation apparatus, human body posture estimation method, and computer program | |
Xia et al. | Autonomous robot dancing driven by beats and emotions of music | |
Egges et al. | Personalised real-time idle motion synthesis | |
KR20160096473A (en) | System and method for motion evaluation | |
CN111724459B (en) | Method and system for redirecting movement of heterogeneous human bones | |
US20160232698A1 (en) | Apparatus and method for generating animation | |
JPH09330424A (en) | Movement converter for three-dimensional skeleton structure | |
CN111179385A (en) | Dance animation processing method and device, electronic equipment and storage medium | |
JP2013257656A (en) | Motion similarity calculation device, motion similarity calculation method, and computer program | |
JP2012141881A (en) | Human body motion estimation device, human body motion estimation method and computer program | |
JP5372823B2 (en) | Video content generation system, metadata construction device, video content generation device, portable terminal, video content distribution device, and computer program | |
JP2013045335A (en) | Control point setting method, control point setting device, and program | |
JP5778523B2 (en) | VIDEO CONTENT GENERATION DEVICE, VIDEO CONTENT GENERATION METHOD, AND COMPUTER PROGRAM | |
JP6059614B2 (en) | Gesture generation device, gesture generation system, gesture generation method, and computer program | |
CN109993818B (en) | Method, device, equipment and medium for synthesizing motion of three-dimensional human body model | |
JP5124439B2 (en) | Multidimensional time series data analysis apparatus and computer program | |
Kim et al. | Reconstructing whole-body motions with wrist trajectories | |
WO2021187093A1 (en) | Image processing device and moving-image data generation method | |
Lin et al. | Temporal IK: Data-Driven Pose Estimation for Virtual Reality | |
JP6092698B2 (en) | Motion data segment determination device, motion data segment determination method, and computer program | |
JP2010231452A (en) | Device and program for analysis of multi-dimensional time series data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130819 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130918 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |