JP7457804B2

JP7457804B2 - ビデオ生成方法および装置、電子装置、およびコンピュータ読み取り可能媒体

Info

Publication number: JP7457804B2
Application number: JP2022528542A
Authority: JP
Inventors: ワン，ヤ; ジアン，ウェイ; ジョン，チーファン; フゥ，ピンフェイ
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2019-11-18
Filing date: 2020-11-17
Publication date: 2024-03-28
Anticipated expiration: 2040-11-17
Also published as: EP4047943A1; BR112022009608A2; US11636879B2; CN112822541A; WO2021098670A1; JP2023501813A; US20220277775A1; KR20220103112A; EP4047943B1; CN112822541B; EP4047943A4

Description

本願は、2019年11月18日に中国国家知識産権局に出願された中国特許出願第201911129727.9号の優先権を主張し、その全開示は、参照により、本願の開示の一部として本明細書に援用される。

技術分野
本開示の実施形態は、コンピュータ技術の分野に関し、より詳細には、ビデオ生成方法、装置、電子装置、およびコンピュータ読み取り可能媒体に関する。

マルチメディア技術の急速な発展に伴い、ビデオ処理技術も急速に進展しており、ビデオを通して情報を伝送したり、ライフスライスを共有したりする人が増えている。一方、ビデオ処理ソフトウェアは、端末上の一般的なソフトウェアとして、さまざまなシナリオに広く適用されている。多くの場合、ユーザーはビデオや音楽などの素材を使ってビデオを作成する必要がある。

しかしながら、現在、ユーザーは、ビデオソフトウェアを使用してビデオを編集するときに、さまざまな素材を処理するために多くのエネルギーと時間を費やす必要がある。現在のビデオ編集モードは、ユーザーにとって十分に単純ではないことがわかる。

本開示の内容は、具体的な実装において詳細に説明される概念を簡略化された形で導入するために使用される。本開示の内容は、特許請求される技術的解決策の主要な特徴または本質的な特徴を特定することを意図したものではなく、また、特許請求される技術的解決策の範囲を限定することを意図したものでもない。

本開示のいくつかの実施形態は、上記の背景に記載された技術的課題を解決するようビデオ生成方法、装置、電子装置、およびコンピュータ読み取り可能媒体を提供する。

第1の側面では、本開示のいくつかの実施形態は、ビデオ生成方法を提供し、この方法は：複数のビデオ素材を含む第1のビデオセットおよびオーディオ素材を取得するステップと；第1のビデオセットにおけるビデオ素材の量に応じて、オーディオ素材の第1の音楽点を決定するステップであって、第1の音楽点は、オーディオ素材を複数の第1の音楽クリップに分割するために使用され、第1の音楽クリップの量は、第1のビデオセットにおけるビデオ素材の量と同じである、ステップと；オーディオ素材における各第1の音楽クリップについて、第1のビデオセットにおけるビデオ素材のソート順に従って、1つのビデオ素材をそれぞれ使用して、1つのビデオクリップを生成して、第1のビデオシーケンスを得るステップであって、互いに対応する第1の音楽クリップおよび第1のビデオクリップは同じ継続時間をもつ、ステップと；第1のビデオシーケンスにおけるビデオクリップ上の編集操作を検出することに応答して、第1のビデオシーケンスにおけるビデオクリップを調整して、第2のビデオシーケンスを得るステップと；第2のビデオシーケンスにおけるビデオクリップを接合し、オーディオ素材をビデオ・オーディオ・トラックとして追加してコンポジット・ビデオ〔合成ビデオ〕を得るステップとを含む。

第2の側面では、本開示のいくつかの実施形態は、ビデオを生成する装置を提供し、この装置は：複数のビデオ素材を含む第1のビデオセットおよびオーディオ素材を取得するよう構成された取得ユニットと；第1のビデオセットにおけるビデオ素材の量に応じて、オーディオ素材の第1の音楽点を決定するよう構成された決定ユニットであって、第1の音楽点は、オーディオ素材を複数の第1の音楽クリップに分割するために使用され、第1の音楽クリップの量は、第1のビデオセットにおけるビデオ素材の量と同じである、決定ユニットと；オーディオ素材における各第1の音楽クリップについて、第1のビデオセットにおけるビデオ素材のソート順に従って、1つのビデオ素材をそれぞれ使用して、1つのビデオクリップを生成して、第1のビデオシーケンスを得るように構成された生成ユニットであって、第1の音楽クリップおよび第1のビデオクリップは互いに同じ継続時間を有する、生成ユニットと；第1のビデオシーケンスにおけるビデオクリップ上の編集操作を検出することに応答して、第1のビデオシーケンスにおけるビデオクリップを調整して、第2のビデオシーケンスを得るように構成された調整ユニットと；第2のビデオシーケンスにおけるビデオクリップを接合し、オーディオ素材をビデオ・オーディオ・トラックとして追加してコンポジット・ビデオを得るように構成された接合ユニットとを有する。

第3の側面では、本開示のいくつかの実施形態は、電子装置を提供し、電子装置は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶される記憶装置とを有する。前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行される場合、前記一つまたは複数のプロセッサは、第1の側面のいずれかの実装による方法を実装する。

第4の側面では、本開示のいくつかの実施形態は、コンピュータ・プログラムが記憶されるコンピュータ読み取り可能媒体を提供する。このプログラムは、プロセッサによって実行されると、第1の側面の任意の実装による方法を実装する。

第5の側面では、本開示のいくつかの実施形態は、コンピュータ・プログラムを提供し、コンピュータ・プログラムは、プログラムコードを含む。コンピュータがコンピュータ・プログラムを実行するとき、プログラムコードは、第1の側面および第2の側面における任意の実装による方法を実行する。

本開示の上述の各実施形態の一つは、以下の有益な効果を有する：オーディオ素材上で音楽点の分割を行うことによって、コンポジット・ビデオ中の各ビデオクリップの継続時間が決定されることができ、その結果、ビデオ素材がコンポジット・ビデオにおけるビデオクリップに処理されることができ、それにより、ユーザーがビデオ素材およびオーディオ素材を処理する時間を短縮し、それにより編集をより容易にすることができる。コンポジット・ビデオ内のビデオクリップを調整することによって、ユーザーにとっての調整の困難さを軽減することができる。ビデオ素材は、ビデオクリップを生成し、さらにコンポジット・ビデオを生成するために使用され、これは、ユーザーのためにビデオクリップとオーディオ素材とのポイントマッチングを直接実行し、ユーザーに多様な選択肢を与え、ユーザー体験をさらに改善する。

本開示のさまざまな実施形態の上記および他の特徴、利点、および側面は、添付の図面と併せて、以下の詳細な実装を参照して、より明白になるであろう。諸図面を通して、同じまたは類似の参照番号は、同じまたは類似の要素を指す。図面は概略的であり、コンポーネントおよび要素は必ずしも縮尺通りに描かれていないことが理解されるべきである。

1Aおよび1Bは、本開示のいくつかの実施形態による、ビデオ生成方法の適用シナリオの概略図である。

本開示によるビデオ生成方法のいくつかの実施形態のフローチャートである。

本開示のいくつかの実施形態による、ビデオクリップに対する回転操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップのソート順に対する調整操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップに対する削除調整操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップに対する追加調整操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップに対する自動最適化調整操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップに対する手動最適化調整操作の概略図である。

本開示のいくつかの実施形態による、ビデオクリップに対する回転調整操作の概略図である。

本開示による、ビデオを生成するための装置のいくつかの実施形態の構造概略図である。

本開示のいくつかの実施形態を実装するのに適した電子装置の構造概略図である。

本開示の実施形態は、添付の図面を参照して、以下により詳細に説明される。本開示のある種の実施形態が図面に示されているが、本開示は、さまざまな形で具現可能であり、本明細書に記載された実施形態に限定されるものと解釈されるべきではないことを理解されたい。むしろ、これらの実施形態は、本開示の十全かつ完全な理解のために提供される。本開示の図面および実施形態は、例示的な目的のためのものに過ぎず、本開示の保護範囲を制限することを意図するものではないことを理解されたい。

なお、図面には、説明の便宜上、関連発明に関係する部分のみを示していることに留意するべきである。矛盾のない条件で、本開示の実施形態および実施形態の特徴は、互いに組み合わされうる。

本開示において言及された「第1」、「第2」などの概念は、異なるデバイス、モジュールまたはユニットを区別するためにのみ使用され、これらのデバイス、モジュールまたはユニットによって実行される機能の順序または相互依存関係を制限するためには使用されないことに留意されたい。

本開示において言及された「ある」および「複数の」の修飾は、制約ではなく例解するものであり、文脈がそうでないことを明確に示すのでない限り、それらが「一つまたは複数」として理解されるべきであることを当業者は理解するはずであることに留意されたい。

本開示の実施形態における複数の装置間で交換されるメッセージまたは情報の名前は、例示的な目的のためのものに過ぎず、これらのメッセージまたは情報の範囲を制限することを意図するものではない。

本願は、添付の図面を参照し、実施形態との関連で、以下に詳細に説明される。

図1のAおよびBは、本願のいくつかの実施形態による、ビデオ生成方法の適用シナリオの概略図である。

図1のAの適用シナリオに示されるように、まず、ユーザーは、端末装置101のアップロードページ1017上で複数のビデオ素材、たとえば、アップロードページ1017に示されるビデオ素材1011～1014を選択することができる。ユーザーは、選択ボックス1015に示された位置をクリックし、ビデオ素材1011～1013を選択する。ユーザーは、「次へ」ボタン1016をクリックし、上述した端末装置101は、選択されたビデオ素材1011～1013の量（ビデオ素材量102は図中では3として示されている）に応じて、取得されたオーディオ素材106内の音楽点107および音楽点108を決定する。オーディオ素材106は、音楽点107と音楽点108に従って、音楽クリップA、B、Cに分割される。ビデオ素材1011～1013は、それぞれ、取得された音楽クリップA～Cの継続時間に従って処理される。ビデオクリップ1031、1041、1051からなる第1のビデオシーケンスが得られる。

その後、ビデオ編集を実行するために、図1Bに示されるように端末装置101のビデオ編集ページ1018にスキップされる。たとえば、ビデオクリップ1031、ビデオクリップ1041、およびビデオクリップ1051から構成される第1のビデオシーケンス109が、ビデオ編集ページ1018に示される。ユーザーは、ビデオ編集ページ1018に示される第1のビデオシーケンス109内のビデオクリップ1051の再生速度調整ボタン1019をクリックする。その後、ユーザーは「次へ」ボタン1020をクリックし、上述の端末装置101は、第1のビデオシーケンス109におけるビデオクリップ1051の再生速度を調整してビデオクリップ1061を得て、次いで、ビデオクリップ1031、1041および1061を第2のビデオシーケンス110に結合する。最後に、上述した端末装置101は、オーディオ素材106において音楽クリップA～Cが現れる時間に従って、第2のビデオシーケンス110におけるビデオクリップ1031、1041、1061を接合し、接合されたビデオのオーディオトラックとしてオーディオ素材106を追加して、コンポジット・ビデオ111を得る。

ビデオ生成方法は、端末装置101によって実行されてもよいし、またはサーバーによって実行されてもよく、またはさまざまなソフトウェアプログラムによって実行されてもよいことが理解できる。端末装置101は、たとえば、スマートフォン、タブレットパーソナルコンピュータ、電子書籍リーダ、ラップトップ、デスクトップ等を含むがこれらに限定されない、表示画面を有するさまざまな電子装置であってもよい。さらに、実行体は、サーバー、ソフトウェアなどとして具現されてもよい。なお、実行体がソフトウェアである場合、上記の電子装置に搭載されてもよい。それは、たとえば、分散サービスを供給するための複数個のソフトウェアまたはソフトウェアモジュールとして実装されてもよく、または、単一のソフトウェアまたはソフトウェアモジュールとして実装されてもよく、これは本明細書では特に限定されない。

図1の端末装置およびサーバーの数は、単に例示的なものであることが理解されるべきである。実装ニーズに応じて、任意の量の端末装置およびサーバーが存在しうる。

引き続き図2を参照すると、本開示によるビデオ生成方法のいくつかの実施形態のフロー200が示される。ビデオ生成方法は、以下のステップを含む。

ステップ201：第1のビデオセットおよびオーディオ素材を取得する。

いくつかの実施形態では、ビデオ生成方法の実行体（たとえば、図1に示される端末装置101）は、有線接続または無線接続を通じてビデオ素材およびオーディオ素材を取得してもよい。上述の第1のビデオセットは、複数のビデオ素材を含む。

一例として、上述のビデオ素材は、ユーザーによってローカルに記憶されたビデオまたはピクチャーであってもよく、またはユーザーによってインターネットからダウンロードされたビデオまたはピクチャーであってもよい。上述のオーディオ素材は、ユーザーによってローカルに記憶された音楽またはネットワーク上の音楽であってもよい。

ステップ202：第1のビデオセット内のビデオ素材の量に応じて、オーディオ素材の第1の音楽点を決定する。

いくつかの実施形態では、上述の実行体は、まず、オーディオ素材の第1の音楽点を決定することができる。ここで、音楽点は、設定されたテンポ遷移条件を満たす、オーディオ素材内の点であってもよい。次いで、上記実行体は、得られたそれぞれの候補音楽点から目標量の音楽点を選択することができる。前記目標量は、通例、取得されたビデオ素材の量に応じて決定される。一例として、10個のビデオ素材を取得された場合、9個の音楽点が決定されてもよい。

また、別の例として、音楽点が、音楽性満足設定が変化するオーディオ素材における位置である場合には、上記の音楽性が変化する位置は、ビートが変化する位置と、メロディーが変化する位置とを含みうる。これに基づいて、音楽点は、次の態様で決定されうる：上述の実行体が上記のオーディオ素材を解析し、その中でのビート点および音符開始点を決定することができ、ビート点は、ビートが変化する位置であり、音符開始点は、メロディーが変化する位置である。具体的には、一方では、深層学習に基づくビート解析アルゴリズムを用いて、オーディオ素材を解析して、オーディオ素材内のビート点と、ビート点が位置するタイムスタンプとを得ることができ、他方では、オーディオ素材に対して短期スペクトル解析が実行されて、オーディオ素材内の音符開始点と、音符開始点が位置するタイムスタンプとを得ることができる。ここで、音符開始点は、開始点検出器によって得ることができる。次いで、2つの仕方で得られたビート点と音符開始点が統一され、ビート点と音符開始点が組み合わされて、重複除去されて、候補音楽点を得る。

ステップ203：第1のビデオシーケンスを得るために、オーディオ素材内の各第1の音楽クリップについて、第1のビデオセット内のビデオ素材のソート順に従って、それぞれ1つのビデオ素材を使用することによって、1つのビデオクリップを生成する。

いくつかの実施形態では、オーディオ素材内の各第1の音楽クリップに関して、上述の実行体は、第1のビデオシーケンスを得るために、第1のビデオセット内のビデオ素材のソート順に従って、音楽クリップについての音楽クリップと同じ継続時間を有する1つのビデオクリップを生成することができる。互いに対応する第1の音楽クリップとビデオクリップは、同じ継続時間をもつ。ここで、第1のビデオシーケンスは、通例、生成されたビデオクリップで構成されるシーケンスを指す。上述のシーケンスのソート順は、ユーザーがビデオ素材をアップロードする順序であってもよく、または上述の実行体によってソートされたランダムな順序であってもよい。

一例として、音楽素材が3つの音楽クリップに分割され、3つの音楽クリップの継続時間がそれぞれ1秒、2秒および3秒であるとすると、上記の音楽クリップに対応するビデオクリップの継続時間は、それぞれ1秒、2秒および3秒であってもよい。

別の例として、音楽素材が第1のクリップと第2のクリップに分割された場合、第1のクリップは第1のビデオセット内の第1のビデオ素材に対応してもよく、第2のクリップは第1のビデオセット内の第2のビデオ素材に対応してもよい。第1のビデオセットにおけるビデオ素材の順序は、たとえば、ユーザーによって選択された順序であってもよい。

さらに別の例として、ビデオ素材の継続時間が第1の音楽クリップの継続時間よりも長い場合には、第1の音楽クリップの継続時間と同じ継続時間を有するビデオクリップがビデオ素材から切り出され；ビデオ素材の継続時間が第1の音楽クリップの継続時間よりも短い場合には、オリジナルのビデオ素材が可変速処理にかけられて継続時間を長くし、次いで可変速処理したビデオ素材がビデオクリップとして使用され、こうしてビデオクリップの継続時間を音楽クリップの継続時間と同じにする。

ビデオ素材中のピクチャー素材に関して、ピクチャー素材からビデオクリップを生成するために多様な実装態様が使用されうることが理解できる。たとえば、ピクチャー素材にアニメーション効果を加えた後に、ビデオクリップが生成されてもよい。上述のアニメーション効果は、ピクチャー素材にランダムに追加される前景アニメーション効果であってもよい。前景アニメーション効果は、たとえば、写真に雨のアニメーション効果を加えるなど、ピクチャーに追加される動的なアニメーション効果であってもよい。ピクチャーにアニメーション効果を加えることで、ピクチャー素材が視覚的により美しくなり、ユーザーの視覚効果が改善される。

ステップ204：第1のビデオシーケンス内のビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整し、第2のビデオシーケンスを得る。

いくつかの実施形態では、第1のビデオシーケンス内のビデオクリップに対するユーザーの編集操作を検出するとき、実行体は、検出された編集操作に従って対応するビデオクリップを調整して、第2のビデオシーケンスを得ることができる。

一例として、上述の調整操作は、第1のビデオシーケンスにおけるビデオクリップに対する再生速度調整操作のようなビデオ編集操作であってもよい。ここで、上述した再生速度調整操作は、プリセット再生速度コントロールのクリック操作、または、プリセット・ジェスチャーをトリガーすることによるビデオクリップ再生速度の調整操作であってもよい。上記の再生速度調整は、再生速度を調整するために、高速再生速度でビデオクリップを再生するか、低速再生速度でビデオクリップを再生するなどして実行されうる。

別の例として、実行体が第1のビデオシーケンスにおけるビデオクリップ2に対してユーザーが行った回転操作を検出する場合、実行体は、上述したビデオクリップ2を回転させて、回転したビデオクリップを得ることができる。ここで、上述した回転操作は、プリセット・ビデオクリップ回転コントロールをクリックする操作、または、ビデオクリップをドラッグして回転する操作であってもよい。

別の例として、上述の回転操作は、図3Aに示されるように、電子装置303によって表示されるインターフェース3050内の回転されたビデオクリップ3051を得るための、電子装置303によって表示されるインターフェース3040内のビデオクリップ3041に対して実行されるドラッグ回転操作3042であってもよい。

すると、実行体は、第1のビデオシーケンス内のビデオクリップ2を、回転されたビデオクリップで置き換えて、第2のビデオシーケンスを得ることができる。

いくつかの実施形態のいくつかの任意的な実装態様では、第1のビデオシーケンスにおけるビデオクリップのソート順に対する調整操作を検出することに応答して、上述の実行体は、ビデオクリップの調整されたソート順に従って、上述の第1のビデオセットにおけるビデオ素材のソート順を調整して、第2のビデオセットを得ることができる。その後、上述の実行体は、上述の第2のビデオシーケンスを得るために、上述のオーディオ素材における各第1の音楽クリップについて、上述の第2のビデオセットにおけるビデオ素材のソート順に従って、それぞれ1つのビデオ素材を使用することによって、1つのビデオクリップを生成することができる。互いに対応する第1の音楽クリップとビデオクリップは、同じ継続時間をもつ。

たとえば、上述した実行体が、ビデオ素材A、B、Cのソート順に従って1s、2s、3sのビデオクリップa、b、cをそれぞれ切り出した後、ソート順をb、c、aに調整するソート順調整操作を検出すると、上述した実行体は、対応するビデオ素材のソート順をビデオ素材B、C、Aのソート順に調整する。その後、1s、2s、3sのビデオクリップb'、c'、a'が、ビデオ素材B、C、Aのソート順に従ってそれぞれ切り出され、ビデオクリップb'、c'、a'から構成される第2のビデオシーケンスを得る。

いくつかの実施形態の任意的な実装態様では、実行体は、上述の第1のビデオシーケンスの第1の提示インターフェースを表示するよう表示機能を有する電子装置を制御することができ；実行体は、上述の第1のビデオシーケンス内のビデオクリップの識別子を、上述の第1の提示インターフェース内で第1のソート位置から第2のソート位置へ移動する調整操作を検出することに応答して、上述のビデオクリップを第2のソート位置へ移動させ、それにより、ビデオクリップの調整されたソート順を決定することができる。次いで、ビデオクリップの調整されたソート順に従って、上述の第1のビデオセットにおけるビデオ素材のソート順が調整される。ここで、上記識別子は、ビデオクリップのプレビュー画像、スクリーンショット、テキスト記述などの識別子であってもよい。

一例として、上述の第1の提示インターフェースは、図3Bに示されるように、電子装置301によって表示されるページ3010であってもよい。第1のビデオシーケンス302内のビデオクリップ3023を第1のソート位置Cから第2のソート位置Bに移動させるユーザーの調整操作3011を検出すると、上述の実行体は、ビデオクリップ3023を第1のソート位置Cから第2のソート位置Bに移動させ、ビデオクリップの調整されたソート順を決定することができる。その後、上述の実行体は、ビデオクリップの調整されたソート順に従って、第1のビデオセット303内のビデオ素材3031～3033のソート順を調整して、第2のビデオセット304を得ることができる。

いくつかの実施形態の任意的な実装態様では、上述の第1のビデオシーケンスにおける第1のビデオクリップに対する削除操作を検出することに応答して、第1のビデオ素材が上述の第1のビデオセットから削除されて第3のビデオセットを得て、上述の第1のビデオクリップは上述の第1のビデオ素材に基づいて生成される；上述の第3のビデオセットにおけるビデオ素材の量に応じて、上述のオーディオ素材の第2の音楽点が決定され、上述の第2の音楽点が、上述のオーディオ素材を複数の第2の音楽クリップに分割するために使用され、上述の第2の音楽クリップの量は、上述の第2のビデオセットにおけるビデオ素材の量と同じである；上述の第3のビデオセットにおけるビデオ素材のソート順に応じて、上述のオーディオ素材における各第2の音楽クリップついて、それぞれ1つのビデオ素材を用いて、1つのビデオクリップが生成されて上述の第2のビデオシーケンスが得られ、互いに対応する第2の音楽クリップとビデオクリップは同じ継続時間を有する。

たとえば、上述の第1のビデオシーケンスa、b、cにおいて第1のビデオクリップbの削除操作を検出すると、上述の実行体は、第1のビデオ素材セットA、B、Cにおいて第1のビデオクリップbを生成するためのビデオ素材Bを削除し、第3のビデオセットA、Cを得る。次いで、実行体は、第3のビデオセットA、Cにおけるビデオ素材の量2に基づいて、上述のオーディオ素材の第2の音楽点を決定し、さらに、上述したオーディオ素材を2つの音楽クリップに分割する。最後に、第3のビデオセットA、Cにおけるビデオ素材Aおよびビデオ素材Cのソート順に従って、2つの第2の音楽クリップについてビデオクリップdおよびビデオクリップが生成され、第2のビデオシーケンスd、eを得る。

いくつかの実施形態のいくつかの任意的な実装態様では、実行体は、上述の第1のビデオシーケンスの第2の提示インターフェースを表示するよう、表示機能を有する電子装置を制御してもよい。上述の第1のビデオシーケンスの第2の提示インターフェースにおける上述の第1のビデオシーケンス内の第1のビデオクリップに対する選択操作を検出することに応答して、上述の第1のビデオ素材からビデオクリップをクリップするための第1のクリッピング操作インターフェースが表示される。上述の第1のクリッピング操作インターフェースにおける削除操作の検出に応答して、上述の第1のビデオ素材が削除される。ここで、上述の選択操作は、第1のビデオクリップをクリックする操作であってもよく、または長押しのような操作であってもよい。上述のクリッピング操作インターフェースは、上述の第1のビデオ素材をクリップするためにユーザーによって使用される操作インターフェースであってもよい。上述した削除操作は、プリセット・コントロールをクリックすることであってもよく、または、上述の第1のビデオ素材をドラッグするなどの関連した操作であってもよい。

例として、上述の第2提示インターフェースは、図4に示されるように、電子装置401によって表示されるページ4010であってもよい。第2の提示ページ4010上の上述の第1のビデオシーケンス4011内の第1のビデオクリップ4014に対する選択操作を検出すると、上述の第1のビデオ素材4023内のビデオクリップをクリップするための第1のクリッピング操作インターフェース4020が表示され；上述の第1のクリッピング操作インターフェース4020内の削除制御4022に対するクリック操作を検出すると、第1のビデオ素材4023が削除される。

いくつかの実施側面のいくつかの任意的な実装態様では、上述の第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材が取得され、上述の第1のビデオセットに追加されて、第4のビデオセットが得られる。上述の第4のビデオセットにおけるビデオ素材の量に応じて、上述のオーディオ素材の第3の音楽点が決定される。上述の第3の音楽点は、上述のオーディオ素材を複数の第3の音楽クリップに分割するために使用される。上述の第3の音楽クリップの量は、上述の第4のビデオセットにおけるビデオ素材の量と同じである。上述の第4のビデオセットにおけるビデオ素材のソート順に従って、上述のオーディオ素材内の各第3の音楽クリップについて、それぞれ1つのビデオ素材を用いて1つのビデオクリップが生成されて、上述の第2のビデオシーケンスが得られる。互いに対応する第3の音楽クリップとビデオクリップは同じ継続時間をもつ。

たとえば、上述の第1のビデオシーケンスa、b、c内のビデオクリップに対する追加操作を検出すると、上述の実行体は、第2のビデオ素材Dを取得し、第1のビデオセットA、B、Cにこれを追加して、第4のビデオセットA、B、C、Dを得る。次いで、第4のビデオセットA、B、C、Dのビデオ素材の量4に応じて、上述のオーディオ素材の第3の音楽点が決定され、上述のオーディオ素材がさらに4つの第3の音楽クリップに分割される。その後、上述の第4のビデオセットA、B、C、D内のビデオ素材A、B、C、Dのソート順に従い、オーディオ素材中の各第3の音楽クリップについて、それぞれ1つのビデオ素材を用いて、1つのビデオクリップが生成されて、第2のビデオシーケンスが得られる。

いくつかの実施形態のいくつかの任意的な実装態様では、上述の実行体は、上述の第1のビデオシーケンスの第3の提示インターフェースを表示してもよい。第3の提示インターフェースにおける上述の第1のビデオシーケンス内のビデオクリップに対する追加操作を検出することに応答して、ビデオ素材のブラウズ・インターフェースが表示される。上述のブラウズ・インターフェースにおいて、上述の第2のビデオ素材の選択操作を検出したことに応答して、上述の第2のビデオ素材が取得され、上述の第1のビデオセットに追加されて、第4のビデオセットが得られる。

例として、上述の第3の提示インターフェースは、図5に示されるように、電子装置501によって表示されるページ5010であってもよい。上述の第3の提示インターフェース5010における第1のビデオシーケンス5011内のビデオクリップの追加コントロール5015のクリック操作を検出すると、ビデオ素材のブラウズ・インターフェース5020が表示される。上述のブラウズ・インターフェース5020において、上述の第2のビデオ素材5023に対する選択操作を検出すると、上述の第2のビデオ素材が取得され、第1のビデオセットに追加されて、第2のビデオセットが得られる。

いくつかの実施側面のいくつかの任意的な実装態様では、上述の第1のビデオシーケンスのビデオクリップは、上述の第1のビデオセット内のビデオ素材から、プリセット開始点位置でクロップされる。

いくつかの実施形態の任意的な実装態様では、上述の第1のビデオシーケンスにおける第2のビデオクリップに対する自動最適化操作を検出することに応答して、複数の初期ビデオクリップが、第3のビデオ素材を使用することによって、上述の第2のビデオクリップに対応する音楽クリップについて異なる開始点位置からクロップされる。上述の第2のビデオクリップに対応する音楽クリップは、上述の各初期ビデオクリップと同じ継続時間をもち、上述の第2のビデオクリップは、第3のビデオ素材に基づいて生成される。上述の複数の初期ビデオクリップに対してそれぞれフレーム抽出が実行され、上記の複数の初期ビデオクリップの品質が、フレーム抽出によって得られた画像に基づいて解析される。最高の品質をもつ第3のビデオクリップが、上述の複数の初期ビデオクリップから選択される。上述の第1のビデオシーケンスでは、上述の第2のビデオクリップは上述の第3のビデオクリップで置き換えられ、上述の第2のビデオシーケンスが得られる。ここで、上述の自動最適化操作とは、通例、プリセット自動最適化コントロールなどをクリックするユーザーの操作を指す。上述の品質とは、通例、ビデオクリップ内のフレーム抽出から得られた画像をスコア化することによって得られる包括的スコアを指す。上記の包括的スコアは、フレーム抽出によって得られた画像スコアの平均スコアまたは最高スコアであってもよい。上述のスコア付け態様は、フレーム内の動き情報（たとえば、ジッタなど）、審美性（構図など）、または属性（光の色など）に基づくことができる。

いくつかの実施形態のいくつかの任意的な実装態様では、上述の実行体は、上述の第1のビデオシーケンス内の第2のビデオクリップの第4の提示インターフェースを表示することができる。上述の第4の提示インターフェースは、自動最適化コントロールを含み、上述の自動最適化コントロールは、自動最適化をトリガーするために使用される。上述の第4の提示インターフェースにおける上述の自動最適化コントロールに対する自動最適化操作を検出することに応答して、第3のビデオ素材を用いて、上述の第2のビデオクリップに対応する音楽クリップについて、種々の開始点位置から、複数の初期ビデオクリップがクロップされる。ここで、上述の自動最適化コントロールは、ジェスチャーをトリガーするためのボタンまたはプリセット・コントロールであってもよい。

一例として、第1のビデオシーケンス内の第2のビデオクリップ6011を表示する上述の第4の提示インターフェースは、図6Aに示されるように、電子装置601によって表示されるページ6010であってもよい。上述の第4の提示インターフェース6010における自動最適化コントロール6013に対するクリック操作を検出すると、複数の初期ビデオクリップ6016～6018が、第3のビデオ素材6014を使用することによって、上述の第2のビデオクリップ6011に対応する音楽クリップ6015についての異なる開始点位置からクロップされる。

いくつかの実施形態のいくつかの任意的な実装態様では、上述の第1のビデオシーケンスにおける第4のビデオクリップに対する手動最適化操作を検出すると、実行体は、上述の第4のビデオ素材における上述の手動最適化操作によって選択されたクロッピング区間を決定することができる。その後、上述のクロッピング区間に従って、上述の第4のビデオ素材から第5のビデオクリップがクロップされる。最後に、上述の第1のビデオシーケンスにおいて、上述の第4のビデオクリップが上述の第5のビデオクリップで置き換えられて、上述の第2のビデオシーケンスが得られる。

いくつかの実施形態のいくつかの任意の実装態様では、上述の実行体は、上述の第1のビデオシーケンスの第5の提示インターフェースを表示してもよい。上述の第5の提示インターフェースにおいて、上述の第4のビデオクリップに対する選択操作を検出することに応答して、上述の第4のビデオ素材からビデオクリップをクリップするための第2のクリッピング操作インターフェースが表示される。上述の第2のクリッピング操作インターフェースにおいて、クリッピング区間に対する選択操作を検出することに応答して、上述の第4のビデオ素材において選択されたクロッピング区間が決定される。

一例として、第1のビデオシーケンス6021を表示する上述の第5の提示インターフェースは、図6Bに示されるように、電子装置602によって表示されるページ6020であってもよい。上述の第5の提示インターフェース6020内の上述の第4のビデオクリップ6024上で選択操作を検出すると、上述の第4のビデオ素材6033内のビデオクリップをクリップするための第2のクリッピング操作インターフェース6030が表示される。上述の第2のクリッピング操作インターフェースにおいて、クリッピング区間6035～6034に対する選択操作を検出すると、第4のビデオ素材において選択されたクロッピング区間6034～6035が決定される。

いくつかの実施形態のいくつかの任意的な実装態様では、上述の実行体は、上述の第1のビデオシーケンス内の第6のビデオクリップに対する回転操作を検出することに応答して、上述の第6のビデオクリップを回転させて第7のビデオクリップを得ることができる。上述の第1のビデオシーケンスでは、上述の第6のビデオクリップが上述の第7のビデオクリップで置き換えられて、上述の第2のビデオシーケンスを得る。

いくつかの実施形態のいくつかの任意の実装態様において、上述の実行体は、上述の第1のビデオシーケンスの第6の提示インターフェースを表示してもよい。上述の第6の提示インターフェースにおける第6のビデオクリップに対する選択操作を検出することに応答して、上述の第6のビデオクリップの回転操作インターフェースが表示される。上述の回転操作インターフェースにおいて、上述の第6のビデオクリップに対する回転操作を検出することに応答して、上述の第6のビデオクリップが回転されて、第7のビデオクリップを得る。

例として、上述の第6の提示インターフェースは、電子装置701上に表示されるページ7010であってもよい。第6のビデオクリップ7014に対する選択操作が検出されると、上述の第6のビデオクリップ7014の回転操作インターフェース7020が表示される。上述の選択操作インターフェース7020において、第6のビデオクリップ7014の回転コントロール7022のクリック操作を検出すると、上述の第6のビデオクリップ7014が回転されて、第7のビデオクリップが得られる。

ステップ205：第2のビデオシーケンス内のビデオクリップを接合し、オーディオ素材をビデオ・オーディオ・トラックとして追加して、コンポジット・ビデオを得る。

ビデオ生成方法の実行体は、上述の音楽クリップが上述のオーディオ素材に現れる順序に従って、上述の音楽クリップに対応する第2のビデオシーケンス内のビデオクリップを順次接合し、接合されたビデオのオーディオトラック内に上述のオーディオ素材を追加してコンポジット・ビデオを得ることができる。

一例として、上述のオーディオ素材は、音楽点に従って順次の3つのクリップに分割されてもよく、たとえば、クリップAは、秒0から秒2までであってもよく、クリップBは、秒2から秒5までであってもよく、クリップCは、秒5から秒10までであってもよい。対応する第2のビデオシーケンスのビデオクリップは、それぞれクリップa、クリップb、およびクリップcである。次いで、接合されたビデオはabcとして表されてもよい。上述のオーディオ素材は、接合されたビデオabcのオーディオトラックに追加され、コンポジット・ビデオが得られる。

なお、上述の第1のビデオシーケンスにおけるビデオクリップに対する編集について、上述の第1のビデオシーケンスにおけるビデオクリップに対する上述の編集は、モードが変換されるときに、保持されてもよい。

一例として、ビデオシーケンス内のビデオ・クリップa、b、cに対してシーケンス調整操作が実行されてビデオ・クリップd、e、fが得られる場合、ビデオ・クリップd、e、fからコンポジット・ビデオAが生成され、モードを切り換えた後でも、生成されたコンポジット・ビデオAは、d、e、fによって生成される。ここで、上述のモードは、通例、オーディオ素材およびビデオセットからコンポジット・ビデオが生成されるモード、またはビデオセット内のビデオ素材を接合することによってコンポジット・ビデオが得られるモードを指す。

本開示のいくつかの実施形態によって開示されるビデオ生成方法では、オーディオ素材上の音楽点の分割を行うことによって、コンポジット・ビデオ中の各ビデオクリップの継続時間が決定でき、それにより、ビデオ素材はコンポジット・ビデオ中のビデオクリップに処理されることができ、こうして、ユーザーにとってビデオ素材およびオーディオ素材を処理する時間を短縮し、よって編集をより容易にする。コンポジット・ビデオ内のビデオクリップを調整することにより、ユーザーにとっての調整の困難が軽減できる。ビデオ素材は、ビデオクリップを生成し、さらにコンポジット・ビデオを生成するために使用され、これは、ユーザーのためにビデオクリップとオーディオ素材とのポイントマッチングを直接実行し、ユーザーに多様な選択肢を与え、ユーザー体験をさらに改善する。

さらに図8を参照すると、上述のそれぞれの図に示された方法の実装として、本開示は、ウェブページ生成装置のいくつかの実施形態を提供し、これらの装置実施形態は、図2に示された方法実施形態に対応し、装置は、さまざまな電子装置に特に適用できる。

図8に示されるように、いくつかの実施形態によるウェブページ生成装置800は、取得ユニット801、決定ユニット802、生成ユニット803、調整ユニット804、および接合ユニット805を含む。取得ユニット801は、第1のビデオセットおよびオーディオ素材を取得するように構成され、前記第1のビデオセットは、複数のビデオ素材を含み；前記決定ユニット802は、前記第1のビデオセットにおけるビデオ素材の量に応じて前記オーディオ素材の第1の音楽点を決定するように構成され、前記第1の音楽点は、前記オーディオ素材を複数の第1の音楽クリップに分割するために使用され、前記第1の音楽クリップの量は、前記第1のビデオセットにおけるビデオ素材の量と同じであり、前記生成ユニット803は、前記オーディオ素材における各第1の音楽クリップについて、前記第1のビデオセットにおける前記ビデオ素材のソート順に従って、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成して、第1のビデオシーケンスを得るように構成され、互いに対応する前記第1の音楽クリップと前記ビデオクリップは、同じ継続時間をもち；前記調整ユニット804は、前記第1のビデオシーケンス内のビデオクリップに対する編集操作の検出に応答して、前記第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得るように構成され；前記接合ユニット805は、前記第2のビデオシーケンス内のビデオクリップを接合して、前記オーディオ素材をビデオ・オーディオ・トラックとして加えて、コンポジット・ビデオを得るように構成される。

いくつかの実施側面の任意的な実装態様において、ビデオ生成装置800の調整ユニット801は、さらに、上述の第1のビデオシーケンスにおけるビデオクリップのソート順に対する調整操作を検出することに応答して、ビデオクリップの調整されたソート順に従って、上述の第1のビデオセットにおけるビデオ素材のソート順を調整し、第2のビデオセットを得て；上述の第2のビデオセットにおけるビデオ素材のソート順に従って、上述のオーディオ素材における各第1の音楽クリップについて、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成し、上述の第2のビデオシーケンスを得るように構成される。互いに対応する第1の音楽クリップとビデオクリップは同じ継続時間をもつ。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第1のサブユニットを含んでいてもよく、第1のサブユニットは、上述の第1のビデオシーケンスの第1の提示インターフェースを表示し；上述の第1の提示インターフェースにおいて、上述の第1のビデオシーケンスにおけるビデオクリップの識別子を第1のソート位置から第2のソート位置へ移動させる調整操作を検出することに応答して、上述のビデオクリップを第2のソート位置に移動させ；さらに、諸ビデオクリップの調整されたソート順を決定し；上述の第1のビデオセットにおけるビデオ素材のソート順を、上述の諸ビデオクリップの調整されたソート順に従って調整するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800の調整ユニット801は、さらに、上述の第1のビデオシーケンスにおける第1のビデオクリップに対する削除操作を検出することに応答して、上述の第1のビデオセットから第1のビデオ素材を削除して、第3のビデオセットを得る段階であって、上述の第1のビデオクリップは、上述の第1のビデオ素材に基づいて生成される、段階と；上述の第3のビデオセットにおけるビデオ素材の量に従って上述のオーディオ素材の第2の音楽点を決定する段階であって、上述の第2の音楽点は、上述のオーディオ素材を複数の第2の音楽クリップに分割するために使用され、上述の第2の音楽クリップの量は、上述の第3のビデオセットにおけるビデオ素材の量と同じである、段階と；上述の第3のビデオセットにおけるビデオ素材のソート順に従って、上述のオーディオ素材における各第2の音楽クリップについて、それぞれ1つのビデオ素材を使って1つのビデオクリップを生成して、上述の第2のビデオシーケンスを得る段階であって、互いに対応する前記第2の音楽クリップと前記ビデオクリップは同じ継続時間をもつ、段階とを実行するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第2のサブユニットを含んでいてもよく、第2のサブユニットは、上述の第1のビデオシーケンスの第2の提示インターフェースを表示し；上述の第1のビデオシーケンスの第2の提示インターフェースにおいて上述の第1のビデオシーケンスにおける第1のビデオクリップに対する選択操作を検出することに応答して、上述の第1のビデオ素材からのビデオクリップをクリッピングするための第1のクリッピング操作インターフェースを表示し；上述の第1のクリッピング操作インターフェースにおける削除操作を検出することに応答して、上述の第1のビデオ素材を削除するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800の調整ユニット801は、さらに、前記第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材を取得し、これを前記第1のビデオセットに追加して第4のビデオセットを得る段階と；前記第4のビデオセットにおけるビデオ素材の量に応じて、前記オーディオ素材の第3の音楽点を決定する段階であって、前記第3の音楽点は、前記オーディオ素材を複数の第3の音楽クリップに分割するために使用され、前記第3の音楽クリップの量は、前記第4のビデオセットにおけるビデオ素材の量と同じである、段階と；前記第4のビデオセットにおけるビデオ素材のソート順に応じて、前記オーディオ素材の各第3の音楽クリップについて、それぞれ1つのビデオ素材を用いて1つのビデオクリップを生成し、前記第2のビデオシーケンスを得る段階であって、互いに対応する第3の音楽クリップとビデオクリップは同じ継続時間をもつ、段階とを実行するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第3のサブユニットを含んでいてもよく、第3のサブユニットは、上述の第1のビデオシーケンスの第3の提示インターフェースを表示し；第3の提示インターフェースにおける上述の第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、ビデオ素材のブラウズ・インターフェースを表示し；上述のブラウズ・インターフェースにおける上述の第2のビデオ素材に対する選択操作を検出することに応答して、上述の第2のビデオ素材を取得し、これを上述の第1のビデオセットに追加して、第4のビデオセットを得るように構成される。

いくつかの実施形態の任意的な実装態様では、上述の第1のビデオシーケンスにおけるビデオクリップは、上述の第1のビデオセットにおけるビデオ素材から、プリセット開始点位置においてクロップされる。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800の調整ユニット801は、さらに：前記第1のビデオシーケンスにおける前記第2のビデオクリップに対する自動最適化操作を検出することに応答して、前記第2のビデオクリップに対応する前記音楽クリップの異なる開始点位置からの複数の初期ビデオクリップを、前記第3のビデオ素材を用いてクロップする段階であって、前記第2のビデオクリップに対応する前記音楽クリップは、前記初期ビデオクリップのそれぞれと同じ継続時間をもち、前記第2のビデオクリップは前記第3のビデオ素材に基づいて生成される、段階と；それぞれ前記複数の初期ビデオクリップに対してフレーム抽出を実行し、フレーム抽出によって得られた画像に基づいて前記複数の初期ビデオクリップの品質を解析する段階と；前記複数の初期ビデオクリップのうちから最高の品質をもつ第3のビデオクリップを選択する段階と；前記第1のビデオシーケンスにおいて前記第2のビデオクリップを前記第3のビデオクリップで置き換えて、前記第2のビデオシーケンスを得る段階とを実行するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第4のサブユニットを含んでいてもよく、第4のサブユニットは、上述の第1のビデオシーケンスにおいて第2のビデオクリップの第4の提示インターフェースを表示する段階であって、上述の第4の提示インターフェースは、自動最適化コントロールを含み、上述の自動最適化コントロールは、自動最適化をトリガーするために使用される、段階と；上述の第4の提示インターフェースにおける上述の自動最適化コントロールに対する自動最適化操作を検出することに応答して、第3のビデオ素材を使用することによって、上述の第2のビデオクリップに対応する音楽クリップの異なる開始点位置からの複数の初期ビデオクリップをクロップする段階とを実行するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800の調整ユニット801は、さらに、上述の第1のビデオシーケンスにおける第4のビデオクリップに対する手動最適化操作を検出することに応答して、上述の第4のビデオ素材における上述の手動最適化操作によって選択されたクロッピング区間を決定し；上述のクロッピング区間に従って、第4のビデオ素材から第5のビデオクリップをクロップし；上述の第1のビデオシーケンスにおいて上述の第4のビデオクリップを上述の第5のビデオクリップで置き換えて、上述の第2のビデオシーケンスを得るように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第5のサブユニットを含んでいてもよく、第5のサブユニットは、上述の第1のビデオシーケンスの第5の提示インターフェースを表示し；上述の第5の提示インターフェースにおける上述の第4のビデオクリップに対する選択操作を検出することに応答して、上述の第4のビデオ素材からビデオクリップをクリッピングするための第2のクリッピング操作インターフェースを表示し；上述の第2のクリッピング操作インターフェースにおけるクリッピング区間に対する選択操作を検出することに応答して、上述の第4のビデオ素材において選択されたクロッピング区間を決定するように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800の調整ユニット801は、さらに：上述の第1のビデオシーケンスにおける第6のビデオクリップに対する回転操作を検出することに応答して、上述の第6のビデオクリップを回転させて第7のビデオクリップを得て；上述の第1のビデオシーケンスにおいて上述の第6のビデオクリップを上述の第7のビデオクリップと置き換えて、上述の第2のビデオシーケンスを得るように構成される。

いくつかの実施形態の任意的な実装態様では、ビデオ生成装置800は、さらに、第6のサブユニットを含んでいてもよく、第6のサブユニットは、上述の第1のビデオシーケンスの第6の提示インターフェースを表示し；上述の第6の提示インターフェースにおいて第6のビデオクリップに対する選択操作を検出することに応答して、上述の第6のビデオクリップの回転操作インターフェースを表示し；上述の回転操作インターフェースにおける第6のビデオクリップに対する回転操作を検出することに応答して、第6のビデオクリップを回転させて、第7のビデオクリップを得るように構成される。

本開示のいくつかの実施形態によって開示されるビデオを生成する装置では、オーディオ素材上の音楽点の分割を行うことによって、コンポジット・ビデオ中の各ビデオクリップの継続時間が決定でき、それにより、ビデオ素材はコンポジット・ビデオ中のビデオクリップに処理されることができ、こうして、ユーザーにとってビデオ素材およびオーディオ素材を処理する時間を短縮し、よって編集をより容易にする。コンポジット・ビデオ内のビデオクリップを調整することにより、ユーザーにとっての調整の困難が軽減できる。ビデオ素材は、ビデオクリップを生成し、さらにコンポジット・ビデオを生成するために使用され、これは、ユーザーのためにビデオクリップとオーディオ素材とのポイントマッチングを直接実行し、ユーザーに多様な選択肢を与え、ユーザー体験をさらに改善する。

以下、図9を参照して、本開示のいくつかの実施形態を実施するのに適した電子装置（たとえば、図1の端末デバイス）900の構造概略図を示す。図9に示される電子装置は単なる一例であり、本開示の実施形態の機能および使用範囲に制限を課すべきではない。

図9に示されるように、電子装置900は、処理装置（たとえば、中央処理装置、グラフィックス・プロセッサなど）901を含んでいてもよく、これは、読み出し専用メモリ（ROM）902に記憶されたプログラム、または記憶装置908からランダム・アクセス・メモリ（RAM）903にロードされたプログラムに従って、さまざまな適切なアクションおよび処理を実行することができる。ランダム・アクセス・メモリ（RAM）903は、さらに、電子装置900の動作に必要なさまざまなプログラムおよびデータを記憶する。処理装置901、ROM 902、およびRAM 903は、バス904を介して互いに接続される。入出力（I/O）インターフェース905もバス904に結合される。

通例、以下の装置がI/Oインターフェース905に結合されてもよい：たとえばタッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイクロフォン、加速度計、ジャイロスコープなどを含む入力装置906；たとえば液晶ディスプレイ（LCD）、スピーカー、バイブレータなどを含む出力装置907；および通信装置909。通信装置909は、電子装置900がデータを交換するために他の電子装置と無線または有線通信を行うことを可能にする。図9は、さまざまな装置を有する電子装置900を示しているが、示されているすべての装置を実装するまたは有する必要はなく、電子装置900は、代わりにより多数またはより少数の装置を実装してもよいことが理解されるべきである。図9に示される各ブロックは、1つの装置を表してもよく、または必要に応じて複数の装置を表してもよい。

特に、本開示のいくつかの実施形態によれば、フローチャートを参照して上述したようなフローは、コンピュータ・ソフトウェア・プログラムとして実装されてもよい。たとえば、本開示のいくつかの実施形態は、コンピュータ読み取り可能媒体に担持されたコンピュータ・プログラムを含むコンピュータ・プログラム・プロダクトを含み、コンピュータ・プログラムは、フローチャートに示された方法を実行するためのプログラムコードを含む。いくつかのそのような実施形態では、コンピュータ・プログラムは、通信装置909を介してネットワークからダウンロードされてインストールされるか、または記憶装置908からインストールされるか、またはROM 902からインストールされうる。処理装置901によって実行されると、コンピュータ・プログラムは、本開示のいくつかの実施形態による方法で定義された上述の機能を実行する。本開示のいくつかの実施形態では、上述のコンピュータ読み取り可能媒体は、コンピュータ読み取り可能な信号媒体またはコンピュータ読み取り可能な記憶媒体、または上記2つの任意の組み合わせであってもよいことに留意されたい。コンピュータ読み取り可能記憶媒体は、たとえば、電子、磁気、光学、電磁、赤外線、もしくは半導体システム、装置、もしくは装置、または上記の任意の適切な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能記憶媒体のより具体的な例は、一つまたは複数の導体を有する電気接続、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ（RAM）、リード・オンリー・メモリ（ROM）、消去可能なプログラマブル・リード・オンリー・メモリ（EPROMまたはフラッシュメモリ）、光ファイバー；ポータブル・コンパクト・ディスク・リード・オンリー・メモリ（CD-ROM）；光記憶装置；磁気記憶装置：またはこれらの適切な組み合わせを含みうるが、これらに限定されない。

本開示のいくつかの実施形態において、コンピュータ読み取り可能記憶媒体は、命令実行システム、装置、またはデバイスによってまたはそれとの関連で使用されうるプログラムを含むまたは記憶している任意の有形な媒体であってもよい。本開示のいくつかの実施形態では、コンピュータ読み取り可能な信号媒体は、ベースバンドで、または搬送波の一部として伝搬されるデータ信号であって、その中でコンピュータ読み取り可能なプログラムコードを搬送するものを含んでいてもよい。そのような伝搬されたデータ信号は、電磁信号、光信号、または上記の任意の適切な組み合わせを含むが、これらに限定されない、多様な形をとることができる。コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記憶媒体以外のコンピュータ読み取り可能な媒体であってもよく、コンピュータ読み取り可能な信号媒体は、命令実行システム、装置、またはデバイスによって、またはそれらと組み合わせて使用するためにプログラムを送信、伝搬、または転送することができる。コンピュータ読み取り可能媒体上に具現されたプログラムコードは、電気ワイヤ、光ケーブル、無線周波数（RF）などまたは上記の任意の適切な組み合わせを含むがこれらに限定されない、任意の適切な媒体を使用して送信することができる。

いくつかの実装態様では、クライアントとサーバーは、ハイパーテキスト転送プロトコル（HTTP）のような、現在知られている、または将来研究開発されるべき任意のネットワークプロトコルと通信してもよく、任意の形または媒体においてデジタルデータを用いて（通信ネットワークを介して）通信し、相互接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（LAN）、ワイドエリアネットワーク（WAN）、インターネット、およびエンドツーエンドネットワーク（たとえば、アドホック・エンドツーエンドネットワーク）、ならびに現在知られているかまたは将来研究開発される任意のネットワークを含む。

上述のコンピュータ読み取り可能媒体は、上述の電子装置に含まれてもよいし、または電子装置に組み込まれることなく単独で存在してもよい。上述のコンピュータ可読媒体は、一つまたは複数のプログラムを含み、一つまたは複数のプログラムが電子装置によって実行されると、前記電子装置は：第1のビデオセットおよびオーディオ素材を取得する段階であって、前記第1のビデオセットは、複数のビデオ素材を含む、段階と；前記第1のビデオセットにおけるビデオ素材の量に応じて前記オーディオ素材の第1の音楽点を決定する段階であって、前記第1の音楽点は、前記オーディオ素材を複数の第1の音楽クリップに分割するために使用され、前記第1の音楽クリップの量は、前記第1のビデオセットにおけるビデオ素材の量と同じである、段階と；前記オーディオ素材における各第1の音楽クリップについて、前記第1のビデオセットにおける前記ビデオ素材のソート順に従って、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成して、第1のビデオシーケンスを得る段階であって、互いに対応する前記第1の音楽クリップと前記ビデオクリップは、同じ継続時間をもつ、段階と；前記第1のビデオシーケンス内のビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得る段階と；前記第2のビデオシーケンス内のビデオクリップを接合して、前記オーディオ素材をビデオ・オーディオ・トラックとして加えて、コンポジット・ビデオを得る段階とを実行させられる。

本開示のいくつかの実施形態による動作を実行するためのコンピュータプログラムコードは、一つまたは複数のプログラミング言語またはそれらの組み合わせで書かれてもよく、上述のプログラミング言語は、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語を含み、「C」言語または類似のプログラミング言語などの従来の手続き型プログラミング言語も含む。プログラムコードは、完全にユーザーのコンピュータ上で、部分的にユーザーのコンピュータ上で、スタンドアローンのソフトウェアパッケージとして、部分的にはユーザーのコンピュータ上で部分的にはリモートコンピュータ上で、または完全にリモートコンピュータまたはサーバー上で実行されうる。リモートコンピュータに関連するシナリオでは、リモートコンピュータは、ローカルエリアネットワーク（LAN）またはワイドエリアネットワーク（WAN）を含む任意のタイプのネットワークを通じてユーザーのコンピュータに接続されてもよく、または外部コンピュータに（たとえば、インターネットサービスプロバイダーを使用してインターネットを通じて）接続がされてもよい。

添付の図面のフローチャートおよびブロック図は、本開示のさまざまな実施形態による、システム、方法、およびコンピュータ・プログラム・プロダクトの可能な実装のアーキテクチャー、機能性、および動作を示す。これに関して、フローチャートまたはブロック図の各ブロックは、特定の論理機能を実装するための一つまたは複数の実行可能な命令を含むモジュール、プログラムセグメント、またはコードの一部を表すことができる。また、いくつかの代替的な実装において、ブロックに記された機能は、添付の図面に記された順序から外れて生起してもよいことにも留意されたい。たとえば、連続して示される2つのブロックは、実際には、実質的に同時に実行されることができる、または、関連する機能に依存して、ブロックは時に、逆順で実行されてもよい。また、ブロック図および／またはフローチャートの各ブロック、およびブロック図および／またはフローチャートのブロックの組み合わせは、指定された機能または動作を実行する特殊目的のハードウェアベースのシステムによって実装されてもよく、または特殊目的のハードウェアおよびコンピュータ命令の組み合わせによって実装されてもよいことに留意されたい。

本開示のいくつかの実施形態に記載されるユニットは、ソフトウェアによって実装されてもよく、またはハードウェアによって実装されてもよい。記載されるユニットは、プロセッサ内に設けられてもよく、該プロセッサは、たとえば、取得ユニット、決定ユニット、生成ユニット、調整ユニット、および接合ユニットを含むプロセッサとして記載されてもよい。これらのユニットの名称は、場合によっては、ユニット自体に対する限定をなさない。たとえば、取得ユニットは、「第1のビデオセットおよびオーディオ素材を取得するためのユニット」と呼ばれることもある。

本願で記載される機能は、少なくとも部分的に、一つまたは複数のハードウェア論理コンポーネントによって実行されてもよい。たとえば、限定されるものではないが、利用可能なハードウェア論理コンポーネントの例示的なタイプは、フィールドプログラマブルゲートアレイ（FPGA）、特定用途向け集積回路（ASIC）、特定用途向け標準製品（ASSP）、システムオンチップ（SOP）、複雑プログラマブル論理デバイス（CPLD）などを含む。

本開示の一つまたは複数の実施形態によれば、ビデオ生成方法が提供される。ビデオ生成方法は：第1のビデオセットおよびオーディオ素材を取得する段階であって、前記第1のビデオセットは、複数のビデオ素材を含む、段階と；前記第1のビデオセットにおけるビデオ素材の量に応じて前記オーディオ素材の第1の音楽点を決定する段階であって、前記第1の音楽点は、前記オーディオ素材を複数の第1の音楽クリップに分割するために使用され、前記第1の音楽クリップの量は、前記第1のビデオセットにおけるビデオ素材の量と同じである、段階と；前記オーディオ素材における各第1の音楽クリップについて、前記第1のビデオセットにおける前記ビデオ素材のソート順に従って、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成して、第1のビデオシーケンスを得る段階であって、互いに対応する前記第1の音楽クリップと前記ビデオクリップは、同じ継続時間をもつ、段階と；前記第1のビデオシーケンス内のビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得る段階と；前記第2のビデオシーケンス内のビデオクリップを接合して、前記オーディオ素材をビデオ・オーディオ・トラックとして加えて、コンポジット・ビデオを得る段階とを含む。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおけるビデオクリップのソート順に対する調整操作を検出することに応答して、ビデオクリップの調整されたソート順に従って、前記第1のビデオセットにおけるビデオ素材のソート順を調整し、第2のビデオセットを得て；前記第2のビデオセットにおけるビデオ素材のソート順に従って、前記オーディオ素材における各第1の音楽クリップについて、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成し、前記第2のビデオシーケンスを得ることを含み、互いに対応する第1の音楽クリップとビデオクリップは同じ継続時間をもつ。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップのソート順に対する調整操作を検出することに応答して、ビデオクリップの調整されたソート順に従って、前記第1のビデオセットにおけるビデオ素材のソート順を調整し、第2のビデオセットを得ることは：前記第1のビデオシーケンスの第1の提示インターフェースを表示し；前記第1の提示インターフェースにおいて、前記第1のビデオシーケンスにおけるビデオクリップの識別子を第1のソート位置から第2のソート位置へ移動させる調整操作を検出することに応答して、前記ビデオクリップを第2のソート位置に移動させ、諸ビデオクリップの調整されたソート順を決定し；前記第1のビデオセットにおけるビデオ素材のソート順を、前記諸ビデオクリップの調整されたソート順に従って調整して、第2のビデオセットを得ることを含む。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおける第1のビデオクリップに対する削除操作を検出することに応答して、前記第1のビデオセットから第1のビデオ素材を削除して、第3のビデオセットを得る段階であって、前記第1のビデオクリップは、前記第1のビデオ素材に基づいて生成される、段階と；前記第3のビデオセットにおけるビデオ素材の量に従って前記オーディオ素材の第2の音楽点を決定する段階であって、前記第2の音楽点は、前記オーディオ素材を複数の第2の音楽クリップに分割するために使用され、前記第2の音楽クリップの量は、前記第3のビデオセットにおけるビデオ素材の量と同じである、段階と；前記第3のビデオセットにおけるビデオ素材のソート順に従って、前記オーディオ素材における各第2の音楽クリップについて、それぞれ1つのビデオ素材を使って1つのビデオクリップを生成して、前記第2のビデオシーケンスを得る段階であって、互いに対応する前記第2の音楽クリップと前記ビデオクリップは同じ継続時間をもつ、段階とを含む。

本開示の一つまたは複数の実施形態によれば、前記第1のビデオシーケンスにおける第1のビデオクリップに対する削除操作を検出することに応答して、前記第1のビデオセットから第1のビデオ素材を削除することは：前記第1のビデオシーケンスの第2の提示インターフェースを表示し；前記第1のビデオシーケンスの第2の提示インターフェースにおいて前記第1のビデオシーケンスにおける第1のビデオクリップに対する選択操作を検出することに応答して、前記第1のビデオ素材からのビデオクリップをクリッピングするための第1のクリッピング操作インターフェースを表示し；前記第1のクリッピング操作インターフェースにおける削除操作を検出することに応答して、前記第1のビデオ素材を削除することを含む。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して第4のビデオセットを得る段階と；前記第4のビデオセットにおけるビデオ素材の量に応じて、前記オーディオ素材の第3の音楽点を決定する段階であって、前記第3の音楽点は、前記オーディオ素材を複数の第3の音楽クリップに分割するために使用され、前記第3の音楽クリップの量は、前記第4のビデオセットにおけるビデオ素材の量と同じである、段階と；前記第4のビデオセットにおけるビデオ素材のソート順に応じて、前記オーディオ素材における各第3の音楽クリップについて、それぞれ1つのビデオ素材を用いて1つのビデオクリップを生成し、前記第2のビデオシーケンスを得る段階であって、互いに対応する第3の音楽クリップとビデオクリップは同じ継続時間をもつ、段階とを含む。

本開示の一つまたは複数の実施形態によれば、前記第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して第4のビデオセットを得ることは：前記第1のビデオシーケンスの第3の提示インターフェースを表示し；第3の提示インターフェースにおける前記第1のビデオシーケンスにおけるビデオクリップに対する追加操作を検出することに応答して、ビデオ素材のブラウズ・インターフェースを表示し；前記ブラウズ・インターフェースにおける前記第2のビデオ素材に対する選択操作を検出することに応答して、前記第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して、第4のビデオセットを得ることを含む。

本開示の一つまたは複数の実施形態によれば、上述の第1のビデオシーケンスにおけるビデオクリップは、上述の第1のビデオセットにおけるビデオ素材から、プリセット開始点位置においてクロップされる。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおける前記第2のビデオクリップに対する自動最適化操作を検出することに応答して、前記第2のビデオクリップに対応する前記音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップを、前記第3のビデオ素材を用いてクロップする段階であって、前記第2のビデオクリップに対応する前記音楽クリップは、前記初期ビデオクリップのそれぞれと同じ継続時間をもち、前記第2のビデオクリップは前記第3のビデオ素材に基づいて生成される、段階と；それぞれ前記複数の初期ビデオクリップに対してフレーム抽出を実行し、フレーム抽出によって得られた画像に基づいて前記複数の初期ビデオクリップの品質を解析する段階と；前記複数の初期ビデオクリップのうちから最高の品質をもつ第3のビデオクリップを選択する段階と；前記第1のビデオシーケンスにおいて前記第2のビデオクリップを前記第3のビデオクリップで置き換えて、前記第2のビデオシーケンスを得る段階とを含む。

本開示の一つまたは複数の実施形態によれば、前記第1のビデオシーケンスにおける前記第2のビデオクリップに対する自動最適化操作を検出することに応答して、前記第2のビデオクリップに対応する前記音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップを、前記第3のビデオ素材を用いてクロップすることは：前記第1のビデオシーケンスにおいて第2のビデオクリップの第4の提示インターフェースを表示する段階であって、前記第4の提示インターフェースは、自動最適化コントロールを含み、前記自動最適化コントロールは、自動最適化をトリガーするために使用される、段階と；前記第4の提示インターフェースにおける前記自動最適化コントロールに対する自動最適化操作を検出することに応答して、第3のビデオ素材を使用することによって、前記第2のビデオクリップに対応する音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップをクロップする段階とを含む。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおける第4のビデオクリップに対する手動最適化操作を検出することに応答して、前記第4のビデオ素材における前記手動最適化操作によって選択されたクロッピング区間を決定し；前記クロッピング区間に従って、第4のビデオ素材から第5のビデオクリップをクロップし；前記第1のビデオシーケンスにおいて前記第4のビデオクリップを前記第5のビデオクリップで置き換えて、前記第2のビデオシーケンスを得ることを含む。

本開示の一つまたは複数の実施形態によれば、前記第1のビデオシーケンスにおける第4のビデオクリップに対する手動最適化操作を検出することに応答して、前記第4のビデオ素材における前記手動最適化操作によって選択されたクロッピング区間を決定することは：前記第1のビデオシーケンスの第5の提示インターフェースを表示し；前記第5の提示インターフェースにおける前記第4のビデオクリップに対する選択操作を検出することに応答して、前記第4のビデオ素材からビデオクリップをクリッピングするための第2のクリッピング操作インターフェースを表示し；前記第2のクリッピング操作インターフェースにおけるクリッピング区間に対する選択操作を検出することに応答して、前記第4のビデオ素材において選択されたクロッピング区間を決定することを含む。

本開示の一つまたは複数の実施形態によれば、第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンス内のビデオクリップを調整して第2のビデオシーケンスを得ることは：前記第1のビデオシーケンスにおける第6のビデオクリップに対する回転操作を検出することに応答して、前記第6のビデオクリップを回転させて第7のビデオクリップを得て；前記第1のビデオシーケンスにおいて前記第6のビデオクリップを前記第7のビデオクリップと置き換えて、前記第2のビデオシーケンスを得ることを含む。

本開示の一つまたは複数の実施形態によれば、前記第1のビデオシーケンスにおける第6のビデオクリップに対する回転操作を検出することに応答して、前記第6のビデオクリップを回転させて第7のビデオクリップを得ることは：前記第1のビデオシーケンスの第6の提示インターフェースを表示し；前記第6の提示インターフェースにおいて第6のビデオクリップに対する選択操作を検出することに応答して、前記第6のビデオクリップの回転操作インターフェースを表示し；前記回転操作インターフェースにおける第6のビデオクリップに対する回転操作を検出することに応答して、第6のビデオクリップを回転させて、第7のビデオクリップを得ることを含む。

本開示の一つまたは複数の実施形態によれば、ビデオ生成装置が：複数のビデオ素材を含む第1のビデオセットおよびオーディオ素材を取得するよう構成された取得ユニットと；第1のビデオセットにおけるビデオ素材の量に応じて、オーディオ素材の第1の音楽点を決定するよう構成された決定ユニットであって、第1の音楽点は、オーディオ素材を複数の第1の音楽クリップに分割するために使用され、第1の音楽クリップの量は、第1のビデオセットにおけるビデオ素材の量と同じである、決定ユニットと；オーディオ素材における各第1の音楽クリップについて、第1のビデオセットにおけるビデオ素材のソート順に従って、それぞれ1つのビデオ素材を使用して、1つのビデオクリップを生成して、第1のビデオシーケンスを得るように構成された生成ユニットであって、互いに対応する第1の音楽クリップおよび第1のビデオクリップは同じ継続時間をもつ、生成ユニットと；第1のビデオシーケンスにおけるビデオクリップに対する編集操作を検出することに応答して、第1のビデオシーケンスにおけるビデオクリップを調整して、第2のビデオシーケンスを得るように構成された調整ユニットと；第2のビデオシーケンスにおけるビデオクリップを接合し、オーディオ素材をビデオ・オーディオ・トラックとして追加してコンポジット・ビデオを得るように構成された接合ユニットとを有する。

本開示の一つまたは複数の実施形態によれば、電子装置が提供される。電子装置は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶される記憶装置とを有する。前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行される場合、前記一つまたは複数のプロセッサは、上記のいずれかの実施形態に記載される方法を実装する。

本開示の一つまたは複数の実施形態によれば、コンピュータ読み取り可能媒体が提供される。コンピュータ読み取り可能媒体にはコンピュータ・プログラムが記憶される。このプログラムは、プロセッサによって実行されると、上記のいずれかの実施形態に記載される方法を実装する。

本開示の一つまたは複数の実施形態によれば、コンピュータ・プログラムが提供される。このコンピュータ・プログラムは、プログラムコードを含む。コンピュータがコンピュータ・プログラムを実行するとき、プログラムコードは、上記のいずれかの実施形態に記載される方法を実行する。

上記の説明は、本開示のいくつかの好ましい実施形態および適用された技術的原理の例示にすぎない。当業者は、本開示の実施形態に関わる本発明の範囲は、上述の技術的特徴の特定の組み合わせによって形成される技術的解決策に限定されるものではなく、また、上述の発明の概念から逸脱することなく、上述の技術的特徴またはそれらの同等の特徴の任意の組み合わせによって形成される他の技術的解決策、たとえば、上述の特徴を本開示の実施形態に開示される同様の機能をもつ技術的特徴で置き換えることによって形成される技術的解決策（ただし、これらに限定されるものではない）もカバーすべきであることを理解するはずである。

Claims

ビデオ生成方法であって：
第1のビデオセットおよびオーディオ素材を取得する段階であって、前記第1のビデオセットは、複数のビデオ素材を含む、段階と；
前記第1のビデオセットにおけるビデオ素材の数に応じて前記オーディオ素材の第1の音楽点を決定する段階であって、前記第1の音楽点は、前記オーディオ素材における、ビートが変化するまたはメロディーが変化する位置であり、前記第1の音楽点は、前記オーディオ素材を複数の第1の音楽クリップに分割するために使用され、第1の音楽点の数は前記第1のビデオセットにおける前記ビデオ素材の数より1少なく、前記第1の音楽クリップの数は、前記第1のビデオセットにおけるビデオ素材の数と同じである、段階と；
前記オーディオ素材における各第1の音楽クリップについて、前記第1のビデオセットにおける前記ビデオ素材のソート順に従って、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成して、第1のビデオシーケンスを得る段階であって、前記第1のビデオセットにおける前記ビデオ素材のソート順は、ユーザーが前記ビデオ素材をアップロードする順序または前記ビデオ素材のランダムな順序であり、互いに対応する前記第1の音楽クリップと前記ビデオクリップは、同じ継続時間をもち、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第1の音楽クリップの継続時間より長い場合、前記第1の音楽クリップの継続時間に等しい継続時間をもつ前記ビデオクリップが前記ビデオ素材から切り出され、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第1の音楽クリップの継続時間より短い場合、前記ビデオ素材は継続時間を長くするよう可変速処理にかけられ、次いで前記可変速処理にかけられた前記ビデオ素材が前記第1の音楽クリップに対応する前記ビデオクリップとして使用され、こうして前記ビデオクリップの継続時間を前記第1の音楽クリップの継続時間と等しくする、段階と；
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得る段階と；
前記第2のビデオシーケンス内のビデオクリップを接合して、前記オーディオ素材をビデオ・オーディオ・トラックとして加えて、コンポジット・ビデオを得る段階とを含む、
方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内のビデオクリップのソート順に対する調整操作を検出することに応答して、前記ビデオクリップの調整されたソート順に従って、前記第1のビデオセットにおけるビデオ素材のソート順を調整し、第2のビデオセットを得る段階であって、前記第1のビデオシーケンス内のビデオクリップのソート順は、前記第1のビデオセットにおける対応するビデオ素材のソート順と同じである、段階と；
前記第2のビデオセットにおけるビデオ素材のソート順に従って、前記オーディオ素材における各第1の音楽クリップについて、それぞれ1つのビデオ素材を用いて、1つのビデオクリップを生成し、前記第2のビデオシーケンスを得る段階であって、互いに対応する前記第1の音楽クリップと前記ビデオクリップは同じ継続時間をもつ、段階とを実行することを含む、
請求項１に記載の方法。
前記第1のビデオシーケンス内のビデオクリップのソート順に対する調整操作を検出することに応答して、前記ビデオクリップの調整されたソート順に従って、前記第1のビデオセットにおけるビデオ素材のソート順を調整し、第2のビデオセットを得ることは：
前記第1のビデオシーケンスの第1の提示インターフェースを表示し；
前記第1の提示インターフェースにおいて、前記第1のビデオシーケンスにおけるビデオクリップの識別子を第1のソート位置から第2のソート位置へ移動させる調整操作を検出することに応答して、前記ビデオクリップを第2のソート位置に移動させ、ビデオクリップの調整されたソート順を決定し；
前記第1のビデオセットにおけるビデオ素材のソート順を、前記諸ビデオクリップの調整されたソート順に従って調整して、第2のビデオセットを得ることを含む、
請求項２に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内の第1のビデオクリップに対する削除操作を検出することに応答して、前記第1のビデオセットから第1のビデオ素材を削除して、第3のビデオセットを得る段階であって、前記第1のビデオクリップは、前記第1のビデオ素材に基づいて生成される、段階と；
前記第3のビデオセットにおけるビデオ素材の数に従って前記オーディオ素材の第2の音楽点を決定する段階であって、前記第2の音楽点は、前記オーディオ素材における、ビートが変化するまたはメロディーが変化する位置であり、前記第2の音楽点は、前記オーディオ素材を複数の第2の音楽クリップに分割するために使用され、第2の音楽点の数は前記第3のビデオセットにおける前記ビデオ素材の数より1少なく、前記第2の音楽クリップの数は、前記第3のビデオセットにおけるビデオ素材の数と同じである、段階と；
前記第3のビデオセットにおけるビデオ素材のソート順に従って、前記オーディオ素材における各第2の音楽クリップについて、それぞれ1つのビデオ素材を使って1つのビデオクリップを生成して、前記第2のビデオシーケンスを得る段階であって、互いに対応する前記第2の音楽クリップと前記ビデオクリップは同じ継続時間をもつ、段階とを含み、
前記第3のビデオセットにおける前記ビデオ素材のソート順は、前記第1のビデオ素材が削除された後の前記第1のビデオセットにおける前記ビデオ素材のソート順と同じであり、
前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第2の音楽クリップの継続時間より長い場合、前記第2の音楽クリップの継続時間に等しい継続時間をもつ前記ビデオクリップが前記ビデオ素材から切り出され、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第2の音楽クリップの継続時間より短い場合、前記ビデオ素材は継続時間を長くするよう可変速処理にかけられ、次いで前記可変速処理にかけられた前記ビデオ素材が前記第2の音楽クリップに対応する前記ビデオクリップとして使用され、こうして前記ビデオクリップの継続時間を前記第2の音楽クリップの継続時間と等しくする、
請求項１ないし３のうちいずれか一項に記載の方法。
前記第1のビデオシーケンス内の第1のビデオクリップに対する削除操作を検出することに応答して、前記第1のビデオセットから第1のビデオ素材を削除することは：
前記第1のビデオシーケンスの第2の提示インターフェースを表示し；
前記第1のビデオシーケンスの第2の提示インターフェースにおいて前記第1のビデオシーケンス内の第1のビデオクリップに対する選択操作を検出することに応答して、前記第1のビデオ素材からの前記ビデオクリップを切り出すための第1のクリッピング操作インターフェースを表示し；
前記第1のクリッピング操作インターフェースにおける前記削除操作を検出することに応答して、前記第1のビデオ素材を削除することを含む、
請求項４に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内の前記ビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して第4のビデオセットを得る段階と；
前記第4のビデオセットにおけるビデオ素材の数に応じて、前記オーディオ素材の第3の音楽点を決定する段階であって、前記第3の音楽点は、前記オーディオ素材における、ビートが変化するまたはメロディーが変化する位置であり、前記第3の音楽点は、前記オーディオ素材を複数の第3の音楽クリップに分割するために使用され、第3の音楽点の数は前記第4のビデオセットにおける前記ビデオ素材の数より1少なく、前記第3の音楽クリップの数は、前記第4のビデオセットにおけるビデオ素材の数と同じである、段階と；
前記第4のビデオセットにおけるビデオ素材のソート順に応じて、前記オーディオ素材における各第3の音楽クリップについて、それぞれ1つのビデオ素材を用いて1つのビデオクリップを生成し、前記第2のビデオシーケンスを得る段階であって、互いに対応する前記第3の音楽クリップと前記ビデオクリップは同じ継続時間をもつ、段階とを含み、
前記第4のビデオセットにおける前記ビデオ素材のソート順は、前記第2のビデオ素材が追加された後の前記第1のビデオセットにおける前記ビデオ素材のソート順と同じであり、
前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第3の音楽クリップの継続時間より長い場合、前記第3の音楽クリップの継続時間に等しい継続時間をもつ前記ビデオクリップが前記ビデオ素材から切り出され、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第3の音楽クリップの継続時間より短い場合、前記ビデオ素材は継続時間を長くするよう可変速処理にかけられ、次いで前記可変速処理にかけられた前記ビデオ素材が前記第3の音楽クリップに対応する前記ビデオクリップとして使用され、こうして前記ビデオクリップの継続時間を前記第3の音楽クリップの継続時間と等しくする、
請求項１ないし５のうちいずれか一項に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する追加操作を検出することに応答して、第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して第4のビデオセットを得ることは：
前記第1のビデオシーケンスの第3の提示インターフェースを表示し；
第3の提示インターフェースにおける前記第1のビデオシーケンス内の前記ビデオクリップに対する前記追加操作を検出することに応答して、前記ビデオ素材のブラウズ・インターフェースを表示し；
前記ブラウズ・インターフェースにおける前記第2のビデオ素材に対する選択操作を検出することに応答して、前記第2のビデオ素材を取得し、該第2のビデオ素材を前記第1のビデオセットに追加して、前記第4のビデオセットを得ることを含む、
請求項６に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップは、前記第1のビデオセットにおける前記ビデオ素材から、プリセット開始点位置においてクロップされる、請求項１ないし７のうちいずれか一項に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内の第2のビデオクリップに対する自動最適化操作を検出することに応答して、前記第2のビデオクリップに対応する音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップを、第3のビデオ素材を用いてクロップする段階であって、前記第2のビデオクリップに対応する前記音楽クリップは、前記初期ビデオクリップのそれぞれと同じ継続時間をもち、前記第2のビデオクリップは前記第3のビデオ素材に基づいて生成されており、前記第3のビデオ素材の継続時間が前記第3のビデオ素材に対応する前記第2のビデオクリップに対応する前記音楽クリップの継続時間より長い場合、前記第2のビデオクリップに対応する音楽クリップの継続時間に等しい継続時間をもつ前記初期ビデオクリップが前記第3のビデオ素材から切り出され、前記第3のビデオ素材の継続時間が前記第3のビデオ素材に対応する前記第2のビデオクリップに対応する音楽クリップの継続時間より短い場合、前記第3のビデオ素材は継続時間を長くするよう可変速処理にかけられ、次いで前記可変速処理にかけられた前記第3のビデオ素材が前記第2のビデオクリップに対応する音楽クリップに対応する前記初期ビデオクリップとして使用され、こうして前記第2のビデオクリップの継続時間を前記初期ビデオクリップの継続時間と等しくする、段階と；
それぞれ前記複数の初期ビデオクリップに対してフレーム抽出を実行し、フレーム抽出によって得られた画像に基づいて前記複数の初期ビデオクリップの品質を解析する段階と；
前記複数の初期ビデオクリップのうちから最高の品質をもつ第3のビデオクリップを選択する段階と；
前記第1のビデオシーケンスにおいて前記第2のビデオクリップを前記第3のビデオクリップで置き換えて、前記第2のビデオシーケンスを得る段階とを含む、
請求項８に記載の方法。
前記第1のビデオシーケンス内の前記第2のビデオクリップに対する自動最適化操作を検出することに応答して、前記第2のビデオクリップに対応する前記音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップを、前記第3のビデオ素材を用いてクロップすることは：
前記第1のビデオシーケンス内の前記第2のビデオクリップの第4の提示インターフェースを表示する段階であって、前記第4の提示インターフェースは、自動最適化コントロールを含み、前記自動最適化コントロールは、自動最適化をトリガーするために使用される、段階と；
前記第4の提示インターフェースにおける前記自動最適化コントロールに対する自動最適化操作を検出することに応答して、前記第3のビデオ素材を使用することによって、前記第2のビデオクリップに対応する音楽クリップについての異なる開始点位置からの複数の初期ビデオクリップをクロップする段階とを含む、
請求項９に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内の第4のビデオクリップに対する手動最適化操作を検出することに応答して、第4のビデオ素材における前記手動最適化操作によって選択されたクロッピング区間を決定し；
前記クロッピング区間に従って、前記第4のビデオ素材から第5のビデオクリップをクロップし；
前記第1のビデオシーケンスにおいて前記第4のビデオクリップを前記第5のビデオクリップで置き換えて、前記第2のビデオシーケンスを得ることを含む、
請求項８に記載の方法。
前記第1のビデオシーケンス内の第4のビデオクリップに対する手動最適化操作を検出することに応答して、前記第4のビデオ素材における前記手動最適化操作によって選択されたクロッピング区間を決定することは：
前記第1のビデオシーケンスの第5の提示インターフェースを表示し；
前記第5の提示インターフェースにおける前記第4のビデオクリップに対する選択操作を検出することに応答して、前記第4のビデオ素材からビデオクリップを切り出すための第2のクリッピング操作インターフェースを表示し；
前記第2のクリッピング操作インターフェースにおける切り出し区間に対する前記選択操作を検出することに応答して、前記第4のビデオ素材において選択されたクロッピング区間を決定することを含む、
請求項１１に記載の方法。
前記第1のビデオシーケンス内の前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンス内の前記ビデオクリップを調整して第2のビデオシーケンスを得ることは：
前記第1のビデオシーケンス内の第6のビデオクリップに対する回転操作を検出することに応答して、前記第6のビデオクリップを回転させて第7のビデオクリップを得て；
前記第1のビデオシーケンスにおいて前記第6のビデオクリップを前記第7のビデオクリップで置き換えて、前記第2のビデオシーケンスを得ることを含む、
請求項１ないし１２のうちいずれか一項に記載の方法。
前記第1のビデオシーケンス内の第6のビデオクリップに対する回転操作を検出することに応答して、前記第6のビデオクリップを回転させて第7のビデオクリップを得ることは：
前記第1のビデオシーケンスの第6の提示インターフェースを表示し；
前記第6の提示インターフェースにおいて第6のビデオクリップに対する選択操作を検出することに応答して、前記第6のビデオクリップの回転操作インターフェースを表示し；
前記回転操作インターフェースにおいて前記第6のビデオクリップに対する前記回転操作を検出することに応答して、前記第6のビデオクリップを回転させて、前記第7のビデオクリップを得ることを含む、
請求項１３に記載の方法。
ビデオを生成するための装置であって：
複数のビデオ素材を含む第1のビデオセットおよびオーディオ素材を取得するよう構成された取得ユニットと；
前記第1のビデオセットにおける前記ビデオ素材の数に応じて、前記オーディオ素材の第1の音楽点を決定するよう構成された決定ユニットであって、前記第1の音楽点は、前記オーディオ素材における、ビートが変化するまたはメロディーが変化する位置であり、前記第1の音楽点は、前記オーディオ素材を複数の第1の音楽クリップに分割するために使用され、第1の音楽点の数は前記第1のビデオセットにおける前記ビデオ素材の数より1少なく、前記第1の音楽クリップの数は、前記第1のビデオセットにおける前記ビデオ素材の数と同じである、決定ユニットと；
前記オーディオ素材における各第1の音楽クリップについて、前記第1のビデオセットにおける前記ビデオ素材のソート順に従って、それぞれ1つのビデオ素材を使用して、1つのビデオクリップを生成して、第1のビデオシーケンスを得るように構成された生成ユニットであって、前記第1のビデオセットにおける前記ビデオ素材のソート順は、ユーザーが前記ビデオ素材をアップロードする順序または前記ビデオ素材のランダムな順序であり、互いに対応する前記第1の音楽クリップおよび前記ビデオクリップは同じ継続時間をもち、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第1の音楽クリップの継続時間より長い場合、前記第1の音楽クリップの継続時間に等しい継続時間をもつ前記ビデオクリップが前記ビデオ素材から切り出され、前記ビデオ素材の継続時間が前記ビデオ素材に対応する前記第1の音楽クリップの継続時間より短い場合、前記ビデオ素材は継続時間を長くするよう可変速処理にかけられ、次いで前記可変速処理にかけられた前記ビデオ素材が前記第1の音楽クリップに対応する前記ビデオクリップとして使用され、こうして前記ビデオクリップの継続時間を前記第1の音楽クリップの継続時間と等しくする、生成ユニットと；
前記第1のビデオシーケンスにおける前記ビデオクリップに対する編集操作を検出することに応答して、前記第1のビデオシーケンスにおける前記ビデオクリップを調整して、第2のビデオシーケンスを得るように構成された調整ユニットと；
前記第2のビデオシーケンスにおけるビデオクリップを接合し、前記オーディオ素材をビデオ・オーディオ・トラックとして追加してコンポジット・ビデオを得るように構成された接合ユニットとを有する、
装置。
一つまたは複数のプロセッサと；
一つまたは複数のプログラムが記憶されている記憶装置とを有する電子装置であって、
前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサは、請求項１ないし１４のうちいずれか一項に記載される方法を実行する、
電子装置。
コンピュータ・プログラムが記憶されているコンピュータ読み取り可能な媒体であって、前記プログラムは、プロセッサによって実行されると、請求項１ないし１４のうちいずれか一項に記載の方法を実装する、媒体。
プログラムコードを含むコンピュータ・プログラムであって、コンピュータが前記コンピュータ・プログラムを実行すると、前記プログラムコードは、請求項１ないし１４のうちいずれか一項に記載の方法を実行する、コンピュータ・プログラム。