JP7732004B2

JP7732004B2 - ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品

Info

Publication number: JP7732004B2
Application number: JP2023578709A
Authority: JP
Inventors: リ，シンウェイ; ツァオ，ジィアジン
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2022-05-10
Filing date: 2023-05-09
Publication date: 2025-09-01
Anticipated expiration: 2043-05-09
Also published as: JP2024528440A; EP4344230A4; US20240296871A1; WO2023217155A1; EP4344230A1; CN117082292A; US12586610B2

Description

［関連出願］
本出願は、２０２２年５月１０日に出願され、発明名称「ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品」、出願番号２０２２１０５０８０６３．２の中国特許出願の優先権を主張する。

［技術分野］
本開示は、ビデオ処理の技術分野に関し、特に、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品に関する。

コンピュータ技術及びモバイル通信技術の急速な発展に伴い、電子機器をベースとする様々なビデオプラットフォームが一般的に使用されるようになり、人々の日常生活を大いに豊かにしている。自分のビデオ作品をビデオプラットフォームで共有し、他のユーザに見てもらうことを喜ぶユーザがますます増えている。

関連技術では、ビデオを作成する場合、ユーザはまずビデオに必要なあらゆる種類の素材を自分で探し出し、その素材に対して一連の複雑なビデオクリッピング操作を行い、最終的にビデオ作品を生成する必要がある。

ユーザはクリッピング経験が不足している場合、ビデオの作成時間コストの増加につながり、かつ作成されたビデオ品質も低くなる。

上記技術的問題を解決するために、本開示の実施例は、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。

第１態様によれば、本開示の実施例はビデオ生成方法を提供し、この方法は、

受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、

クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、

ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、

ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。

第２態様によれば、本開示の実施例はビデオ生成装置を提供し、この装置は、
受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るためのターゲットマルチメディアデータ生成モジュールと、
ターゲットマルチメディアデータに基づいてターゲットビデオを生成するためのターゲットビデオ生成モジュールと、を備える。

第３態様によれば、本開示の実施例は電子機器を提供し、前記電子機器は、
１つまたは複数のプロセッサと、
１つまたは複数のプログラムを記憶するための記憶装置と、を備え、
１つまたは複数のプログラムが１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサに上記第１側面のいずれか１項に記載のビデオ生成方法を実行させる。

第４態様によれば、本開示の実施例は、コンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供し、前記プログラムがプロセッサによって実行されると、上記第１態様のいずれか１項に記載のビデオ生成方法を実行させる。

第５態様によれば、本開示の実施例は、コンピュータプログラムまたは命令を含むコンピュータプログラム製品を提供し、前記コンピュータプログラムまたは命令がプロセッサによって実行されると、上記第１態様のいずれか１項に記載のビデオ生成方法を実行させる。

本開示の実施例は、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、前記方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。本開示の実施例では、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。

添付図面と併せて、以下の具体的な実施形態を参照して、本開示の各実施例の上記および他の特徴、利点および態様をより明らかにする。添付図面全体を通して、同一または類似の符号は、同一または類似の要素を示す。なお、添付図面は概略図であり、実物および要素は必ずしも縮尺通りに描かれていないことを理解されたい。
本開示の実施例が提供するビデオ作成シナリオのアーキテクチャ図である。本開示の実施例中のビデオ生成方法の概略フローチャートである。本開示の実施例中のテンプレートテーマコントロールのトリガーの概略図である。本開示の実施例中のテンプレートコントロールのトリガーの概略図である。本開示の実施例中のテンプレート適用プロンプトの概略図である。本開示の実施例中のビデオ生成装置の概略構造図である。本開示の実施例中の電子機器の概略構造図である。

以下、添付図面を参照しながら本開示の実施例をより詳細に説明する。添付図面に本開示のいくつかの実施例が図示されているが、本開示は様々な形態で実現され得、本明細書に記載された実施例に限定されなく、むしろ、これらの実施例は、本開示のより徹底的かつ完全な理解のために提供されることを理解されたい。なお、本開示の添付図面および実施例は例示的な目的でのみ使用され、本開示の保護範囲を限定することを意図するものではないことを理解されたい。

なお、本開示の方法実施形態に記載された各ステップは異なる順序で、および／または並行して実行されてもよい。さらに、方法実施形態は、追加のステップを含み、および／または図示されたステップの実行を省略してもよい。本開示の範囲はこの点において特に限定されない。

本明細書で使用される用語「含む」およびその変形は開放的であり、すなわち「含むが、これに限定されない」を意味する。用語「に基づく」は、「少なくとも一部に基づく」を意味する。用語「一実施例」は「少なくとも１つの実施例」を意味し、用語「別の実施例」は「少なくとも１つの他の実施例」を意味し、用語「いくつかの実施例」は「少なくともいくつかの実施例」を意味する。他の用語の関連する定義は以下の説明において示される。

なお、本開示で言及される「第１」、「第２」などの概念は、異なる装置、モジュールまたはユニットを区別するために使用され、これらの装置、モジュールまたはユニットによって実行される機能の順序または相互依存性を定義するために使用されないことに留意されたい。

なお、本開示で言及される「１つ」、「複数」の修飾は、限定的ではなく例示的なものであることに留意されたく、当業者は、文脈上別段の明示がないかぎり、「１つまたは複数」と理解されるべきであることを理解されたい。

本開示の実施形態における複数の装置間で相互作用するメッセージまたは情報の名称は、例示的な目的でのみ使用され、これらのメッセージまたは情報の範囲を限定することを意図していない。

本出願の実施例を詳細に説明する前に、まず本出願の実施例の適用シナリオを説明する。

ユーザがドキュメントを扱う場合、テキストの形式で提示されることがほとんどであり、ユーザがテキストを読むのは手間がかかるため、テキスト情報をビデオに変換することで、ユーザがテキストを解読するのに苦労することなく、音声を聞きながらビデオ画面を見ることで、記事で伝えられている情報を明確にすることができ、ユーザの情報取得の難易度を下げることができる。または、文章が長く、ユーザが文章を読むのに手間がかかるため、１つ１つ読む気力がないため、記事をビデオに変換し、ビデオを通して記事で伝えられている情報を素早く理解し、その後、記事の中から自分の興味のあるものを選んでじっくり読む。また、ビデオの表現形式は多様化されているため、退屈な文章を読むのに比べ、ユーザの関心を引きやすく、ユーザはこの方法で記事を読むことに積極的になる。

関連技術では、テキストデータからキーワードを抽出し、各キーワードについて、所定の画像ライブラリからキーワードに一致するビデオ画像を検索し、タイポグラフィ規則に従ってテキスト情報およびビデオ画像を合成して、ターゲットビデオを得る必要がある。しかし、関連技術中、検索されたビデオ画像とテキストデータとの単純な合成のみが行われ、作成されたビデオの品質が高くなく、その後、ユーザはビデオを手動でクリッピングする必要があり、ユーザはクリッピング経験が不足している場合、ビデオの品質に影響を与える。

本出願の実施例では、テキストデータに基づいて初期マルチメディアデータを生成した後、１つのターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、初期マルチメディアデータのクリッピング処理を実現し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。図１は、本開示の実施例が提供するビデオ作成シナリオのアーキテクチャ図を示す。

図１に示すように、前記アーキテクチャ図は、クライアントの少なくとも１つの電子機器１０１およびサーバーの少なくとも１つのサーバー１０２を含み得る。電子機器１０１は、ネットワークプロトコル、例えばハイパー・テキスト・トランスファー・プロトコル（ＨｙｐｅｒＴｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌｏｖｅｒＳｅｃｕｒｅＳｏｃｋｅｔＬａｙｅｒ, ＨＴＴＰＳ）を介して、接続を確立し、サーバー１０２と対話する。ここで、電子機器１０１は、携帯電話、タブレットコンピュータ、デスクトップパソコン、ノートパソコン、車載端末、ウェアラブルデバイス、オールインワンコンピュータ、スマートホームデバイスなどの通信機能を備えた装置、または仮想マシンやシミュレータによってシミュレートされた装置を含んでもよい。サーバー１０２は、クラウドサーバーまたはサーバークラスタなど、記憶や演算機能を有する装置を含んでもよい。

上記アーキテクチャに基づいて、ユーザは、電子機器１０１上の指定されたプラットフォーム内でビデオを作成することができ、指定されたプラットフォームは、指定されたアプリケーションプログラムまたは指定されたウェブサイトであってもよい。ユーザはビデオを作成した後、指定プラットフォームのサーバー１０２に該ビデオを送信し、サーバー１０２は電子機器１０１から送信されたビデオを受信し、受信したビデオを記憶し、該ビデオを再生する必要のある電子機器に該ビデオを送信することができる。

本開示の実施例では、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させるために、電子機器１０１は、初期マルチメディアデータに対するユーザのクリッピングテンプレート取得要求を受信し、電子機器１０１が該クリッピングテンプレート取得要求を受信した後、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成することができる。このように、ターゲットビデオの生成過程で取得されたターゲットクリッピングテンプレート中のクリッピング操作を初期マルチメディアデータに直接適用することにより、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。

選択可能に、上記アーキテクチャに基づいて、電子機器１０１はクリッピングテンプレート取得要求を受信してターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成することにより、電子機器１０１はローカルでターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットビデオを生成し、ビデオの作成時間コストをさらに削減する。

選択可能に、上記アーキテクチャに基づいて、電子機器１０１はクリッピングテンプレート取得要求を受信した後、サーバー１０２にテンプレート識別子を含むクリッピングテンプレート取得要求を送信することもできる。サーバー１０２は電子機器１０１から送信されたテンプレート識別子を含むクリッピングテンプレート取得要求を受信した後、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成し、電子機器１０１に生成されたターゲットビデオを送信し、電子機器１０１は、サーバー１０２に対して、クリッピングテンプレート取得要求に基づいて、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットビデオを生成するように要求することができ、作成されたビデオ品質をさらに向上させ、電子機器１０１のデータ処理量を削減することもできる。

例えば、電子機器は、モバイル端末、固定端末またはポータブル端末、例えば携帯電話、ステーション、ユニット、デバイス、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、コミュニケータ、デスクトップパソコン、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、パーソナル通信システム（ＰＣＳ）装置、パーソナルナビゲーション装置、パーソナルデジタルアシスタント（ＰＤＡ）、オーディオ／ビデオプレーヤ、デジタルカメラ／カムコーダ、測位装置、テレビ受信機、ラジオ放送受信機、電子書籍装置、ゲーム装置またはそれらの任意の組み合わせを含む（これらの装置の付属品および周辺機器、またはこれらの任意の組み合わせを含む）。

サーバーは、物理サーバーであってもクラウドサーバーであってもよく、サーバーは単一のサーバーであってもサーバークラスタであってもよい。

以下、添付図面と併せて、本出願の実施例が提出するビデオ生成方法を詳細に説明する。

図２は、本開示の実施例中のビデオ生成方法のフローチャートであり、本実施例はテキスト情報に基づいてビデオを生成する場合に適用可能であり、本方法はビデオ生成装置によって実行され得、前記ビデオ生成装置はソフトウェアおよび／またはハードウェアの方式で実現され得、前記ビデオ生成方法は図１に記載の電子機器に実装され得る。

図２に示すように、本開示の実施例が提供するビデオ生成方法は主にステップＳ１０１～Ｓ１０４を含む。

Ｓ１０１、受信したテキストデータに基づいて初期マルチメディアデータを生成する。
本開示の一実施例では、テキストデータは、ユーザが入力装置によって電子機器に入力したデータであってもよく、他の装置から電子機器に送信されたデータであってもよい。

本開示の一実施例では、受信したテキストデータに基づいて初期マルチメディアデータを生成する前に、ユーザのデータ入力操作に応答して、テキストデータを受信することをさらに含む。ここで、ユーザのデータ入力操作は、テキストデータの追加操作を含んでもよく、テキストデータの入力操作を含んでもよく、本実施例では特に限定されない。

本開示の一実施例では、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含む。

本開示の一実施形態では、受信したテキストデータに基づいて初期マルチメディアデータを生成することは以下を含む。受信したテキストデータを少なくとも１つのテキストフラグメントに分割し、テキストフラグメントは複数のターゲットテキストフラグメントを含む。各ターゲットテキストフラグメントについて、ターゲットテキストフラグメントに基づいてプリセット画像ライブラリからターゲットテキストフラグメントに対応するビデオ画像を検索し、ビデオ画像をプリセット動画効果に従って処理し、ターゲットテキストフラグメントに対応するターゲットビデオフラグメントを得る。ターゲットテキストフラグメントに一致する読み上げ音声を取得し、ターゲット音声フラグメントを生成する。ターゲットビデオフラグメントとターゲット音声フラグメントを合成して、ターゲットマルチメディアフラグメントを得る。各ターゲットテキストフラグメントに対して、複数のターゲットマルチメディアフラグメントを取得し、複数のターゲットマルチメディアフラグメントをターゲットテキストフラグメントの前後順序で合成して、初期マルチメディアデータを取得する。

本開示の一実施形態では、ビデオ画像は、ターゲットテキストフラグメントに一致する字幕テキストを含む。

本開示の実施例では、ユーザがビデオを視聴する過程で読み上げ音声に対応する字幕を直感的に見ることを容易にし、ユーザの視聴体験を向上させるために、ビデオ画像にターゲットテキストフラグメントに一致する字幕テキストを追加する。

Ｓ１０２、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得する。

本開示の一実施形態では、クリッピングテンプレート取得要求に対する応答は、ユーザによる電子機器の操作を受け付けた後、クリッピングテンプレート取得要求に対する応答であってもよい。初期マルチメディアデータの生成を検出した後、クリッピングテンプレート取得要求に対する応答であってもよい。

ターゲットクリッピングテンプレートは、ユーザによる電子機器の操作に基づいて選択されたクリッピングテンプレートであってもよく、テキストデータ中のキーワードに基づいて自動的に照合されるクリッピングテンプレートであってもよい。

本開示の一実施形態では、ターゲットクリッピングテンプレートを取得することは、電子機器がローカルで予め記憶されたテンプレートデータベースからターゲットクリッピングモジュールを取得することを含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートを取得することは、電子機器がターゲットクリッピングテンプレートに対応するテンプレート識別子を取得し、テンプレート識別子を含むクリッピングテンプレート取得要求をサーバーに送信し、サーバーが該テンプレート識別子を含むクリッピングテンプレート取得要求に応答し、テンプレート識別子に基づいてターゲットクリッピングテンプレートを取得し、取得したターゲットクリッピングテンプレートを電子機器に返信することを含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートが取得されなかった場合、電子機器の表示インターフェースに１つのプロンプトポップアップボックスを表示し、前記プロンプトポップアップボックスは、ターゲットクリッピングテンプレートの取得に失敗したことを提示するために使用される。

本開示の一実施形態では、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定すること、ターゲットクリッピングテンプレートを取得すること、を含む。

本開示の一実施形態では、電子機器の対話インターフェースに少なくとも１つのテンプレートテーマコントロールが表示され、ユーザによるテンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定する。

図３に示すように、ユーザによるテンプレートテーマ１コントロールのトリガー操作に応答して、テンプレートテーマ１コントロールに対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定する。

本開示の実施例では、ユーザのトリガー操作により、ターゲットクリッピングテンプレートを選択することで、ユーザが満足するクリッピングテンプレートを選択しやすくなり、ユーザの使用体験が向上する。

本開示の一実施形態では、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示すること、ここで、ビデオ編集領域にテンプレートコントロールが含まれ、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、マスク領域に少なくとも１つのテンプレートテーマコントロールを表示すること、をさらに含む。

本開示の実施例では、図４に示すように、初期マルチメディアデータを生成した後、電子機器の表示インターフェースに、ビデオプレビュー領域１０およびビデオ編集領域２０が表示され、ビデオ編集領域２０に複数の編集コントロール、例えば、テンプレートコントロール、画面コントロール、テキストコントロール、読み上げ音色コントロールおよび音楽コントロールが含まれる。ここで、テンプレートコントロールは、既存のテンプレートを使用して初期マルチメディアデータを編集することをユーザに指示するために使用される。画面コントロールは、初期マルチメディアデータ中のビデオ画像を編集することをユーザに指示するために使用される。テキストコントロールは、初期マルチメディアデータ中の字幕テキストを編集することをユーザに指示するために使用される。読み上げ音色コントロールは、初期マルチメディアデータ中の読み上げ音声を編集することをユーザに指示するために使用される。音楽コントロールは、初期マルチメディアデータ中のＢＧＭを編集することをユーザに指示するために使用される。

本開示の一実施形態では、図４に示すように、ユーザによるテンプレートコントロールのトリガー操作に応答して、１つのマスク領域が表示され、マスク領域に複数のクリッピングテンプレートテーマコントロールが表示される。マスク領域に対する左右スワイプ操作に応答して、左右スワイプの効果を伴って複数のクリッピングテンプレートテーマコントロールを表示する。

本開示の実施例では、ユーザによるテンプレートコントロールのトリガー操作に応答した後、複数のテンプレートテーマコントロールが表示されるので、操作が簡単で理解しやすく、ユーザの操作の利便性が高い。

Ｓ１０３、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る。

本開示の一実施形態では、ターゲットクリッピングテンプレートは、少なくとも１つのクリッピング操作を含み、前記クリッピング操作は初期マルチメディアデータに適用されることで、初期マルチメディアデータに対してクリッピング操作を行うことができる。

本開示の一実施形態では、図５に示すように、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用する過程で、初期マルチメディアデータのクリッピングには一定時間がかかるため、電子機器の表示インターフェースに適用プロンプトボックスが表示され、前記適用プロンプトボックスは、クリッピングテンプレートにより示されたクリッピング操作で初期マルチメディアビデオに対してクリッピング処理を行っていることをユーザに指示するために使用される。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作が初期マルチメディアデータに正常に適用された場合、クリッピングテンプレートの適用成功のプロンプトメッセージが表示され、ターゲットクリッピングテンプレートにより示されたクリッピング操作が初期マルチメディアデータに失敗して適用された場合、クリッピングテンプレートの適用失敗のプロンプトメッセージが表示され、クリッピングテンプレートの再選択をユーザに促す。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む。

本開示の実施形態では、ターゲットクリッピングテンプレートは、１つまたは複数のビデオフラグメントを含む。ターゲットクリッピングテンプレートにより示されたクリッピング操作は、ビデオ合成操作の場合、ターゲットクリッピングテンプレートに含まれる１つまたは複数のビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成し、ターゲットマルチメディアデータを得ることを含む。

本開示の実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントをマルチメディアフラグメントの任意２つのビデオフレーム間に追加する。上記ビデオフラグメント合成操作は、既存のビデオ合成方法のいずれかであってもよく、本実施例において特に限定されない。

本開示の実施例では、クリッピングテンプレート中のビデオ合成操作により、複数のビデオの合成を実現し、ユーザがビデオを手動で合成することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。

本開示の一実施形態では、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成し、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データの前、および／または、初期マルチメディアデータの最後のフレーム媒体データの後、を含む。

本開示の実施例では、ターゲットクリッピングテンプレートは、複数のビデオフラグメントおよび各ビデオフラグメントに対応する追加位置を含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントに対応する追加位置がプロローグ位置である場合、該ビデオフラグメントをターゲットビデオプロローグとして初期マルチメディアデータの最初のフレーム媒体データの前に追加する。

本開示の一実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントに対応する追加位置がエピローグ位置である場合、該ビデオフラグメントをターゲットビデオのプロローグとして初期マルチメディアデータの最後のフレーム媒体データの後に追加する。

本開示の一実施形態では、テキストデータにテキストテーマが含まれた場合、テキストテーマをプロローグに対応するビデオフラグメント中のテキストテーマの位置に追加し、ターゲットクリッピングテンプレートに含まれるテキストテーマ表示効果に従ってテキストテーマを編集して画面上にレンダリングする。さらに、テキストデータにテキスト著作者が含まれた場合、テキスト著作者をプロローグに対応するビデオフラグメント中のテキスト著作者の位置に追加し、ターゲットクリッピングテンプレートに含まれるテキスト著作者表示効果に従ってテキスト著作者情報を編集して画面上にレンダリングする。

本開示の一実施形態では、ビデオ作成者の情報を取得した場合、ビデオ作成者の情報をエピローグに対応するビデオフラグメント中の作成者の位置に追加し、ターゲットクリッピングテンプレートに含まれるビデオ作成者表示効果に従ってビデオ作成者の情報を編集して画面上にレンダリングする。

本開示の実施例では、クリッピングテンプレート中のビデオ合成操作により、プロローグおよび／またはエピローグの追加操作を実現することで、ユーザがプロローグまたはエピローグを手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加し、ターゲットマルチメディアデータを得ることを含む。

本開示の一実施形態では、初期マルチメディアデータはテキストデータに一致する複数のビデオ画像を含み、複数ビデオ画像を切り替える過程で、必然的に画像遷移設定を伴う。関連技術では、ユーザは、２つの隣接するビデオ画像間の遷移効果を手動で設定する必要があり、ビデオの作成時間コストが増加する。

本開示の一実施形態では、遷移効果は、カットインアニメーション効果、点滅アニメーション効果、グラデーションアニメーション効果、クロスディゾルブアニメーション効果、ズームアニメーション効果などのうちの１つまたは複数を含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、遷移設定操作は複数の遷移効果タイプを含む。遷移設定操作に含まれる複数遷移効果タイプのマルチメディアフラグメントへの適用に基づいて、各マルチメディアフラグメントはそれぞれ対応する遷移効果を有する。

本開示の一実施形態では、遷移設定操作に遷移効果タイプが含まれる場合、該遷移効果タイプをマルチメディアフラグメントに適用することにより、マルチメディアフラグメントが同じ遷移効果を有する。

本開示の実施例では、クリッピングテンプレート中の遷移設定操作により、マルチメディアフラグメントに遷移効果を付加し、ユーザが遷移効果を手動で設定することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、仮想対象追加操作によりターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得ることを含む。

本開示の一実施形態では、仮想対象は、ターゲットビデオフラグメント、仮想ステッカー、仮想オブジェクト、仮想カードなどの様々な対象を含む。選択可能に、顔装飾特徴、髪飾り特徴、衣服特徴および衣服アクセサリ特徴などを含んでもよい。

本開示の一実施形態では、ターゲットクリッピングテンプレートに保存された仮想対象を初期マルチメディアデータのプリセット位置に直接追加してもよい。選択可能に、プリセット位置の具体的なパラメータはターゲットクリッピングテンプレートに保存されてもよい。ターゲットクリッピングテンプレートに保存されたフラッシュ効果のステッカーを第３幅ビデオ画像に追加してもよい。

本開示の一実施形態では、テキスト情報に提示されたキーワードに基づいて、仮想対象の追加位置を決定してもよい。選択可能に、仮想対象をキーワードに対応するビデオ画像に追加してもよい。

本開示の実施例では、クリッピングテンプレート中の仮想対象追加操作により、マルチメディアフラグメントに仮想対象を追加することで、ユーザが仮想対象を手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートは背景音声を含む。背景音声追加操作により、背景音声に対応するタイムスタンプおよび読み上げ音声に対応するタイムスタンプに基づいて、背景音声と読み上げ音声を混合して、ターゲットマルチメディアデータを得る。

本開示の一実施形態では、読み上げ音声の再生パラメータに基づいて背景音声の再生パラメータを調整して、両者をよりよく融合させる。

本開示の実施例では、クリッピングテンプレート中の背景音声の追加操作により、マルチメディアフラグメントにＢＧＭを追加し、ユーザがＢＧＭを手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用することは、少なくとも１つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出すること、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。

本開示の一実施形態では、キーワードは、日付、数字、人物名称、専用名称、地名、植物、動物などを含む。

本開示の一実施形態では、ターゲットテキストフラグメントは「張三が同日に李四に現金２０万元を支払った」であり、前記ターゲットテキストフラグメントから抽出されたキーワードは「２０万元」である場合、キーワード「２０万元」を該ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加する。

本開示の一実施形態では、ターゲットクリッピングモジュールはキーワードパラメータをさらに含み、ここで、キーワードパラメータは、キーワードの色、フォント、追加効果などを含む。キーワードパラメータに従って、ターゲットマルチメディアフラグメントにおけるキーワードの表示情報を設定する。

本開示の実施例では、クリッピングテンプレート中のキーワード抽出操作により、マルチメディアフラグメントにキーワードを追加することで、ユーザが該テキストフラグメントのキー情報をより明確に理解できる。

本開示の一実施形態では、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、キーワードに一致するキーテキスト情報を取得すること、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。

本開示の実施例では、ターゲットテキストフラグメントからキーワードを抽出した後、上記キーワードに基づいてキーワードに一致するキー情報を取得する。例えば、キーワードは「王五」であり、キーワードに一致するキー情報は、「王五が俳優であり、代表作が《テレビシリーズＡ》、《映画Ｂ》である」である。このとき、「王五」をキーワードとし、「俳優」、「代表作《テレビシリーズＡ》、《映画Ｂ》」をキーテキスト情報として、ターゲットマルチメディアフラグメントに追加する。また、キーワードが「職務上横領罪」であり、それに一致するキーテキスト情報が「職務上横領罪とは、会社、企業その他の単位に属する者が、その地位の利便性を利用して、比較的多額の金銭をもって、その単位の財産を不正に自分のものとする行為をいう」である場合、「職務上横領罪」をキーワードとし、「職務上横領罪とは、会社、企業その他の単位に属する者が、その地位の利便性を利用して、比較的多額の金銭をもって、その単位の財産を不正に自分のものとする行為をいう」をキーテキスト情報として、ターゲットマルチメディアフラグメントに追加する。

本開示の一実施形態では、キーワード、キーテキスト情報に異なる表示パラメータを設定してもよい。

本開示の一実施形態では、上記キーワードに一致するキーテキスト情報は、テキストデータから抽出されたテキスト情報であってもよく、インターネットまたはプリセット知識ベースから取得したテキスト情報であってもよい。キーテキスト情報の取得方法は本実施例では特に限定されない。

本開示の実施例では、キーワードによりキーテキスト情報を抽出し、キーワードとキーテキスト情報をビデオに追加することで、ユーザはキーワードに関連する知識を素早く理解し、テキストデータの内容を理解することを支援する。

Ｓ１０４、ターゲットマルチメディアデータに基づいてターゲットビデオを生成する。

本開示の実施例はビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、この方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。本開示の実施例では、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成することで、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。

図６は、本開示の実施例中のビデオ生成方法のフローチャートであり、本実施例はテキスト情報に基づいてビデオを生成する場合に適用可能であり、本方法は、ビデオ生成装置によって実行され得、前記ビデオ生成装置はソフトウェアおよび／またはハードウェアの方式で実現され得、前記ビデオ生成装置は電子機器に設けられ得る。

図６に示すように、本開示の実施例が提供するビデオ生成装置６０は主に、初期マルチメディアデータ生成モジュール６１、ターゲットクリッピングテンプレート取得モジュール６２、ターゲットマルチメディアデータ生成モジュール６３およびターゲットビデオ生成モジュール６４を備える。

ここで、初期マルチメディアデータ生成モジュール６１は、受信したテキストデータに基づいて初期マルチメディアデータを生成するために使用され、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、ターゲットクリッピングテンプレート取得モジュール６２は、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するために使用され、ターゲットマルチメディアデータ生成モジュール６３は、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るために使用され、ターゲットビデオ生成モジュール６４は、ターゲットマルチメディアデータに基づいてターゲットビデオを生成するために使用される。

本開示の一実施形態では、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するために使用されるターゲットクリッピングテンプレート取得モジュール６２は、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定するために使用されるターゲットクリッピングテンプレート決定ユニットと、ターゲットクリッピングテンプレートを取得するために使用されるターゲットクリッピングテンプレート取得ユニットと、を備える。

本開示の一実施形態では、ターゲットクリッピングテンプレート取得モジュール６２は、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示するために使用されるビデオ編集領域表示ユニットと、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示し、マスク領域に少なくとも１つのテンプレートテーマコントロールを表示するために使用されるマスク領域表示ユニットと、をさらに備える。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得るために使用される。

本開示の一実施形態では、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得るために使用され、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および／または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加して、ターゲットマルチメディアデータを得るために使用される。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得るために使用される。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得るために使用される。

本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、少なくとも１つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出し、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。

本開示の一実施形態では、ターゲットマルチメディアデータ生成モジュール６３は、具体的に、キーワードに一致するキーテキスト情報を取得し、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。

本開示の実施例が提供するビデオ生成装置は、本開示の方法実施例が提供するビデオ生成方法中のステップを実行可能であり、その実行ステップおよび有益な効果はここで繰り返さない。

図７は、本開示の実施例中の電子機器の概略構造図である。以下の図７を具体的に参照すると、本開示の実施例の実施に適した電子機器７００の概略構造図である。本開示の実施例中の電子機器７００は、携帯電話、ノートパソコン、デジタル放送受信機、ＰＤＡ（パーソナルデジタルアシスタント）、ＰＡＤ（タブレットコンピュータ）、ＰＭＰ（ポータブルマルチメディアプレーヤ）、車載端末（例えば車載ナビゲーション端末）、ウェアラブル端末装置などのモバイル端末、およびデジタルＴＶ、デスクトップパソコン、スマートホーム装置などの固定端末を含むが、これらに限定されない。図７に示す電子機器は単なる例示であり、本開示の実施例の機能および使用範囲を何ら限定するものではない。

図７に示すように、電子機器７００は、読み取り専用メモリ（ＲＯＭ）７０２に記憶されたプログラムまたは記憶装置７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたプログラムに従って様々な適切な動作および処理を実行して本開示の実施例の画像レンダリング方法を実現するための処理装置（例えば中央処理装置、グラフィックプロセッサなど）７０１を備える。ＲＡＭ７０３には、端末装置７００の操作に必要な様々なプログラムおよびデータがさらに記憶される。処理装置７０１、ＲＯＭ７０２およびＲＡＭ７０３はバス７０４を介して互いに接続される。入力／出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続される。

通常、Ｉ／Ｏインターフェース７０５には、タッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイク、加速度計、ジャイロスコープなどの入力装置７０６、液晶ディスプレイ（ＬＣＤ）、スピーカ、バイブレータなどの出力装置７０７、磁気テープ、ハードディスクなどの記憶装置７０８、および通信装置７０９が接続される。通信装置７０９により、端末装置７００が無線または有線通信を介して他の装置とデータを交換することができる。図７では様々なデバイスを備えた端末装置７００が図示されているが、図示されたデバイスのすべてを実装または具備する必要がないことを理解されたい。代替的に、より多くのまたはより少ないデバイスを実装または具備してもよい。

特に、本開示の実施例によれば、フローチャートを参照して上記したプロセスは、コンピュータソフトウェアプログラムとして実装されてもよい。例えば、本開示の実施例は、非一過性のコンピュータ可読媒体上に担持されるコンピュータプログラムを含むコンピュータプログラム製品を提供し、前記コンピュータプログラムは前記のビデオ生成方法を実行するためのプログラムコードを含む。このような実施例では、前記コンピュータプログラムは、通信装置７０９を介してネットワークからダウンロードされ、インストールされてもよく、または記憶装置７０８からインストールされてもよく、またはＲＯＭ７０２からインストールされてもよい。このコンピュータプログラムが処理装置７０１によって実行されると、本開示の実施例の方法において定義された上記機能が実現される。

なお、本開示に記載のコンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体または上記両者の任意の組み合わせであってもよい。コンピュータ可読記憶媒体は例えば電気、磁気、光、電磁気、赤外線、または半導体のシステム、装置またはデバイス、または任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、１つまたは複数の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバー、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ-ＲＯＭ）、光記憶デバイス、磁気記憶デバイス、または上記の任意適切な組み合わせであってもよいが、これらに限定されない。本開示では、コンピュータ可読記憶媒体は、プログラムを含むまたは記憶する任意の有形媒体であってもよく、このプログラムが命令実行システム、装置またはデバイスによって使用される、または組み合わせて使用されてもよい。本開示では、コンピュータ可読信号媒体は、ベースバンドで、またはキャリアの一部として伝搬されるデータ信号を含んでもよく、コンピュータ可読プログラムコードが担持される。このような伝搬データ信号は、電磁信号、光信号または上記の任意の適切な組み合わせを含むが、これらに限定されない。コンピュータ可読信号媒体は、命令実行システム、装置またはデバイスによって使用される、または組み合わせて使用されるプログラムを送信、伝搬または転送するコンピュータ可読記憶媒体以外の任意のコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体に含まれるプログラムコードは、ワイヤ、光ファイバケーブル、ＲＦ（無線周波数）など、または上記の任意の適切な組み合わせなどの任意の適切な媒体によって転送されてもよいが、これらに限定されない。

いくつかの実施形態では、クライアント、サーバーは、ＨＴＴＰ（ＨｙｐｅｒＴｅｘｔＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ、ハイパーテキスト・トランスファー・プロトコル）などの任意の現在既知または将来開発されるネットワークプロトコルを使用して通信してもよく、任意形式または媒体のデジタルデータ通信（例えば、通信ネットワーク）と相互接続してもよい。通信ネットワークの例としては、ローカルエリアネットワーク（「ＬＡＮ」）、ワイドエリアネットワーク（「ＷＡＮ」）、インターネットワーク（例えば、インターネット）およびエンドツーエンドネットワーク（例えば、ａｄｈｏｃエンドツーエンドネットワーク）、および任意の現在既知または将来開発されるネットワークが挙げられる。

上記コンピュータ可読記憶媒体は、上記電子機器に含まれてもよく、または前記電子機器に組み込まれずに別体であってもよい。

上記コンピュータ可読記憶媒体は、１つまたは複数のプログラムを格納しており、上記１つまたは複数のプログラムが前記端末装置によって実行されると、前記端末装置に、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を実行させる。

選択可能に、上記１つまたは複数のプログラムが前記端末装置によって実行されると、前記端末装置に上記実施例に記載の他のステップを実行させることができる。

１つまたは複数のプログラミング言語またはその組み合わせで、本開示の動作を実行するためのコンピュータプログラムコードを記述することができ、上記プログラミング言語は、オブジェクト指向プログラミング言語（Ｊａｖａ、Ｓｍａｌｌｔａｌｋ、Ｃ++など）、および従来の手続き型プログラミング言語（「Ｃ」言語または類似のプログラミング言語）を含むが、これらに限定されない。プログラムコードは、完全にユーザのコンピュータ上で実行してもよく、部分的にユーザのコンピュータ上で実行してもよく、スタンドアロンソフトウェアパッケージとして実行してもよく、部分的にユーザのコンピュータ上で実行し、部分的にリモートコンピュータ上で実行してもよく、または完全にリモートコンピュータまたはサーバー上で実行してもよい。リモートコンピュータの場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）またはワイドエリアネットワーク（ＷＡＮ）などのあらゆる種類のネットワークを介してユーザのコンピュータに接続されてもよいし、または、外部コンピュータに接続されてもよい（例えばインターネットサービスプロバイダを使用してインターネットを介して接続される）。

添付図面のフローチャートおよびブロック図は、本開示の様々な実施例に従ったシステム、方法およびコンピュータプログラム製品の可能なアーキテクチャ、機能および動作を示す。この点で、フローチャートまたはブロック図の各ボックスは、１つのモジュール、プログラムセグメント、またはコードの一部を表す場合があり、このモジュール、プログラムセグメント、またはコードの一部は指定された論理機能を実装するための１つまたは複数の実行可能命令を含む。また、代替としてのいくつかの実装では、ボックス内に示された機能は、添付図面に示された順序と異なる順序で発生する可能性もあることに留意されたい。例えば、連続して表現された２つのボックスは実際には実質的に並行して実行されることがあり、関連する機能によって、逆の順序で実行されることもある。また、ブロック図および／またはフローチャート中の各ボックス、およびブロック図および／またはフローチャート中のボックスの組み合わせは、指定された機能または操作を実行する専用のハードウェアベースのシステムで実装されてもよいし、または専用ハードウェアとコンピュータ命令の組み合わせで実装されてもよいことに留意されたい。

本開示の実施例において説明されるユニットはソフトウェアによって実装されてもよく、ハードウェアによって実装されてもよい。ここで、ユニットの名称は、所与の状況におけるユニット自身の限定を構成するものではない。

本明細書において上記した機能は少なくとも部分的に、１つまたは複数のハードウェア論理構成要素によって実行されてもよい。例えば、非限定的に、使用され得る例示的なハードウェア論理構成要素は、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、複合プログラマブル論理デバイス（ＣＰＬＤ）などを含む。

本開示の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって使用される、または命令実行システム、装置またはデバイスと組み合わせて使用されるプログラムを含むまたは記憶する有形の媒体であってもよい。コンピュータ可読記憶媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体は、電子、磁気、光学、電磁、赤外線、または半導体システム、装置またはデバイス、またはこれらの任意の適切な組み合わせを含むが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、１つまたは複数のワイヤに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバー、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ-ＲＯＭ）、光学記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、この方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ビデオ画像は、ターゲットテキストフラグメントに一致する字幕テキストを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定すること、ターゲットクリッピングテンプレートを取得すること、を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示すること、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、マスク領域に少なくとも１つのテンプレートテーマコントロールを表示すること、をさらに含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および／または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加し、ターゲットマルチメディアデータを得ることを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得ることを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用することは、少なくとも１つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出すること、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、キーワードに一致するキーテキスト情報を取得すること、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、この装置は、受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、少なくとも１つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るために使用されるターゲットマルチメディアデータ生成モジュールと、ターゲットマルチメディアデータに基づいてターゲットビデオを生成するために使用されるターゲットビデオ生成モジュールと、を備える。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ビデオ画像はターゲットテキストフラグメントに一致する字幕テキストを含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレート取得モジュールは、クリッピングテンプレート取得要求に応答して、取得ターゲットクリッピングテンプレートするために使用され、ターゲットクリッピングテンプレート決定ユニットは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定するために使用され、ターゲットクリッピングテンプレート取得ユニットは、ターゲットクリッピングテンプレートを取得するために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレート取得モジュールは、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示するためのビデオ編集領域表示ユニットと、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示し、マスク領域に少なくとも１つのテンプレートテーマコントロールを表示するためのマスク領域表示ユニットと、をさらに備える。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得るために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットマルチメディアデータ生成モジュールは、具体的に、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得るために使用され、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および／または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加して、ターゲットマルチメディアデータを得るために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得るために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得るために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、少なくとも１つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出し、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。

本開示の１つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットマルチメディアデータ生成モジュールは、具体的に、キーワードに一致するキーテキスト情報を取得し、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。

本開示の１つまたは複数の実施例によれば、本開示は電子機器を提供し、
１つまたは複数のプロセッサと、
１つまたは複数のプログラムを記憶するためのメモリと、を備え、
１つまたは複数のプログラムが１つまたは複数のプロセッサによって実行されると、１つまたは複数のプロセッサに、本開示が提供するいずれか１つのビデオ生成方法を実行させる。

本開示の１つまたは複数の実施例によれば、本開示はコンピュータ可読記憶媒体を提供し、コンピュータプログラムが記憶され、前記プログラムがプロセッサによって実行されると本開示が提供するいずれか１つのビデオ生成方法を実行させる。

本開示の実施例は、コンピュータプログラム製品をさらに提供し、前記コンピュータプログラム製品はコンピュータプログラムまたは命令を含み、前記コンピュータプログラムまたは命令がプロセッサによって実行されると上記のビデオ生成方法を実行させる。

以上の説明は、本開示の好ましい実施例、および採用される技術的原理の説明例示である。当業者にとって、本開示に関わる開示範囲は、上記技術的特徴の特定の組み合わせによって形成される技術的解決策に限定されるものではなく、上記開示範囲から逸脱することなく、上記技術的特徴またはその等価特徴の任意の組み合わせによって形成される他の技術的解決策もカバーすべきであることを理解されたい。例えば、上記した特徴を、本開示に開示される同様機能を有する技術的特徴と置換するによって形成される技術的解決策（これらに限定されない）もカバーする。

さらに、各動作は特定の順序を用いて描かれているが、これは、動作が示された特定の順序または順次実行されることを要求するものとして解釈されるべきではない。特定の環境において、マルチタスクおよび並行処理は有利であり得る。同様に、いくつかの具体的な実装の詳細が上記の議論に含まれているが、これらは、本開示の範囲を限定するものとして解釈されるべきではない。単一実施例の文脈で説明した特定の特徴は、単一の実施例において組み合わせて実装することもできる。逆に、単一の実施例の文脈で説明した様々な特徴も、個別に、または任意の適切なサブコンビネーションで、複数の実施例で実施することができる。

本主題は、構造的特徴および／または方法論理作用に特有の言語を用いて説明されてきたが、添付の特許請求の範囲に定義される主題は、必ずしも上述の特定の特徴または作用に限定されないことを理解されたい。むしろ、上述した特定の特徴および動作は、特許請求の範囲を実施する例示的な形態に過ぎない。

Claims

ビデオ生成方法であって、
受信したテキストデータに基づいて初期マルチメディアデータを生成することであって、前記初期マルチメディアデータは前記テキストデータの読み上げ音声が前記テキストデータに一致するビデオ画像を含み、前記初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、前記少なくとも１つのマルチメディアフラグメントはそれぞれ前記テキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、前記少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、前記少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、前記ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、前記ターゲットビデオフラグメントは前記ターゲットテキストフラグメントに一致するビデオ画像を含み、前記ターゲット音声フラグメントは、前記ターゲットテキストフラグメントに一致する読み上げ音声を含む、生産すること、
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、および、
前記ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含み、
前記クリッピング操作は、ビデオ合成操作、遷移設定操作、仮想対象追加操作、背景音声追加操作、およびキーワード抽出操作のうちの少なくとも１つを含む、
ことを特徴とする方法。
前記ビデオ画像は、前記ターゲットテキストフラグメントに一致する字幕テキストを含む、ことを特徴とする請求項１に記載の方法。
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、
テンプレートテーマコントロールのトリガー操作に応答して、前記トリガー操作に対応するクリッピングテンプレートを前記ターゲットクリッピングテンプレートとして決定すること、
前記ターゲットクリッピングテンプレートを取得すること、を含む、ことを特徴とする請求項１に記載の方法。
クリッピングテンプレートコントロールのトリガー操作に応答する前に、
ビデオ編集領域を表示すること、ここで、前記ビデオ編集領域はテンプレートコントロールを含み、
前記テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、
前記マスク領域に少なくとも１つのテンプレートテーマコントロールを表示すること、をさらに含む、ことを特徴とする請求項３に記載の方法。
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントと前記初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項１に記載の方法。
前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントと前記初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることは、
前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントを前記初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、前記設定位置は、前記初期マルチメディアデータの最初のフレーム媒体データの前、および／または、前記初期マルチメディアデータの最後のフレーム媒体データの後、を含む、ことを特徴とする請求項５に記載の方法。
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
前記遷移設定操作に基づいて前記初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を追加し、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項１に記載の方法。
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
前記仮想対象追加操作に基づいて、前記ターゲットクリッピングテンプレートに含まれる仮想対象を前記初期マルチメディアデータのプリセット位置に直接追加して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項１に記載の方法。
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
前記背景音声追加操作に基づいて、前記ターゲットクリッピングテンプレートに含まれる背景音声と前記初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項１に記載の方法。
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用することは、
少なくとも１つのターゲットテキストフラグメントに対して、前記ターゲットテキストフラグメント中のキーワードを抽出すること、
前記キーワードを前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む、ことを特徴とする請求項１に記載の方法。
前記キーワードを前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、
前記キーワードに一致するキーテキスト情報を取得すること、
前記キーワードと前記キーテキスト情報を前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む、ことを特徴とする請求項１０に記載の方法。
受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、前記初期マルチメディアデータは、前記テキストデータの読み上げ音声が前記テキストデータに一致するビデオ画像を含み、前記初期マルチメディアデータは少なくとも１つのマルチメディアフラグメントを含み、前記少なくとも１つのマルチメディアフラグメントはそれぞれ前記テキストデータによって分割された少なくとも１つのテキストフラグメントに対応し、前記少なくとも１つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、前記少なくとも１つのテキストフラグメント中のターゲットテキストフラグメントに対応し、前記ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、前記ターゲットビデオフラグメントは前記ターゲットテキストフラグメントに一致するビデオ画像を含み、前記ターゲット音声フラグメントは、前記ターゲットテキストフラグメントに一致する読み上げ音声を含み、
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るためのターゲットマルチメディアデータ生成モジュールと、
前記ターゲットマルチメディアデータに基づいてターゲットビデオを生成するためのターゲットビデオ生成モジュールと、を備え、
前記クリッピング操作は、ビデオ合成操作、遷移設定操作、仮想対象追加操作、背景音声追加操作、およびキーワード抽出操作のうちの少なくとも１つを含む、ことを特徴とするビデオ生成装置。
１つまたは複数のプロセッサと、
１つまたは複数のプログラムを記憶するための記憶装置と、を備え、
前記１つまたは複数のプログラムが前記１つまたは複数のプロセッサによって実行されると、前記１つまたは複数のプロセッサに請求項１～１１のいずれか１項に記載の方法を実行させる、ことを特徴とする電子機器。
コンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、請求項１～１１のいずれか１項に記載の方法を実行させる、ことを特徴とするコンピュータ可読記憶媒体。
コンピュータプログラムまたは命令を含むコンピュータプログラムであって、前記コンピュータプログラムまたは命令がプロセッサによって実行されると請求項１～１１のいずれか１項に記載の方法を実行させる、コンピュータプログラム。