JP7450112B2

JP7450112B2 - 文字モードでビデオを生成する方法、装置、機器、および媒体

Info

Publication number: JP7450112B2
Application number: JP2023506273A
Authority: JP
Inventors: ウー，イーイン; スン，フゥイ; ワン，ダオユー
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2020-09-25
Filing date: 2021-09-18
Publication date: 2024-03-14
Anticipated expiration: 2041-09-18
Also published as: EP4171047A4; US20240170026A1; JP2023534757A; KR102613143B1; US20230130806A1; WO2022063093A1; CN112153475A; CN112153475B; US11922975B2; KR20230023804A; EP4171047A1

Description

本開示の様々な実装は、コンピューターの分野に関し、具体的には、文字モードでビデオを生成するための方法、装置、電子デバイス、およびコンピューター記憶媒体に関する。

情報技術の発展に伴い、様々な情報共有のためのアプリが提供されている。ユーザーは文字を編集し、または、写真やビデオを撮影して、情報共有アプリで公開することができる。ビデオには音や画像、文字など様々な情報が含まれるため、ビデオ情報は幅広いユーザーにとって身近な情報となっている。ビデオ編集アプリは、ビデオへの文字挿入をサポートするために開発された。しかし、ユーザーがメッセージングアプリに文字ベースのビデオを投稿しようとすると、まず、ビデオ編集アプリでビデオを生成・保存し、それをメッセージングアプリにアップロードする必要がある。そのため、文字ベースのビデオをより便利で効果的に生成するための研究が注目されている。

本開示の第１態様において、情報共有アプリにおける文字パターンビデオを生成するための方法が提供される。本方法では、情報共有アプリのユーザーからビデオ生成の要求を受け付ける。情報共有アプリでは、ビデオを生成するための初期ページが表示され、初期ページには文字を入力するためのプロンプトが表示される。初期ページがある領域でユーザーのタッチを検出したことに応じて、ユーザーからの文字入力を取得する。入力された文字をもとに、情報共有アプリで公開するためのビデオを生成する。

本開示の第２態様において、情報共有アプリにおいて文字モードでビデオを生成するための装置が提供される。この装置は、情報共有アプリのユーザーからビデオ生成の要求を受信するように構成された受信モジュールと、情報共有アプリにおいて、ビデオを生成するための初期ページを表示するように構成された表示モジュールと、初期ページは文字入力のためのプロンプトを含み、初期ページが位置する領域でのユーザーのタッチを検出することに応答してユーザーから文字入力をフェッチするように構成されたフェッチモジュールと、情報共有アプリで公開するための文字入力に基づくビデオを生成するように構成された生成モジュールを含む。

本開示の第３態様において、電子デバイスが提供される。電子デバイスは、メモリと、プロセッサーと、メモリは、1つ以上のコンピューター命令を格納するために使用され、1つ以上のコンピューター命令は、プロセッサーによって実行されて、本開示の第１態様に従う方法を実施することを特徴とする。

本開示の第４態様において、1つ以上のコンピューター命令が格納されたコンピューター可読記憶媒体が提供され、1つ以上のコンピューター命令は、プロセッサーによって実行されて本開示の第１態様による方法を実施する。

本開示の例示的な実装を使用すると、ユーザーは、情報共有アプリ内で直接文字入力に基づいて対応するビデオを生成することができる。このように、ユーザーの操作の複雑さを軽減し、より豊富な種類の公開コンテンツをユーザーに提供することができる。

本開示の様々な実施態様の上記及び他の特徴、利点及び態様は、添付図と共に、及び、以下の詳細な説明を参照することにより、より明らかになる。添付図において、同一または類似の添付ラベルは、同一または類似の要素を示している。
図1は、本開示の例示的な実施態様による、アプリ環境のブロック図を概略的に示す。図2は、本開示の例示的な実施態様による、文字モードでビデオを生成するためのユーザーインターフェースのブロック図を概略的に示す。図3は、本開示の例示的な実施態様による、文字モードでビデオを生成するための方法のフローチャートを概略的に示す。図4は、本開示の例示的な実施態様による、文字を入力するためのユーザーインターフェースのブロック図である。図5は、本開示の例示的な実施態様による、ビデオ背景を選択するためのユーザーインターフェースのブロック図である。図6は、本開示の例示的な実施態様による、ビデオを編集するためのユーザーインターフェースのブロック図を概略的に示す図である。図7は、本開示の例示的な実施態様による、ビデオをプレビューするためのユーザーインターフェースのブロック図を概略的に示す図である。図8は、本開示の例示的な実施態様による、文字モードでビデオを生成するための装置のブロック図を概略的に示す図である。図9は、本開示の複数の実装を実施することができるコンピューターデバイスのブロック図である。

本開示の実施形態は、添付図を参照しながら、以下により詳細に説明される。本開示の特定の実施態様が添付図に示されているが、本開示は、様々な形態で実施することができ、本説明書に示された実施態様に限定されると解釈されるべきではなく、むしろ、これらの実施態様は、本開示をより徹底的かつ完全に理解するために提供されているべきである。本開示の添付図及び実施形態は、例示的な目的のためのものであり、本開示の保護範囲を限定することを意図していない。

本開示の実施形態の説明において、用語「含む」及び同様の用語は、開放的に包括的、すなわち「含むがこれに限定されない」ことを意味する。「に基づく」という用語は、「少なくとも部分的に基づく」ことを意味する。用語「1つの実施形態」または「その実施形態」は、「少なくとも1つの実施形態」として理解されるべきである。「第1」、「第2」等の用語は、異なる対象物または同一の対象物を指す場合がある。その他の定義については、明示的・暗黙的の別を問わず、以下に記載することがある。

すでに様々な情報共有のためのアプリケーション（以下、アプリと呼ぶ）が提供されている。ビデオは多面的な情報を含むことができるため、幅広い層のユーザーがビデオタイプのメディア情報をより快適に利用することができる。説明を容易にするために、本開示の例示的な実施態様によるアプリ環境の概要について、最初に図1を参照する。具体的には、図1は、本開示の例示的な実施態様による、アプリ環境100のブロック図である。図1において、ユーザーは、アプリ110を介して、ビデオを視聴し、かつ／あるいは、および／または投稿することができる。例えば、アプリ110は、ビデオ120をユーザーにプッシュすることができ、ユーザーは、検索、スクロール、ページ送りなどをして、お気に入りのビデオを視聴することができる。さらに、ユーザーは、「公開」ボタン130を押して、ビデオを公開することができる。

ユーザーが、写真を撮ってビデオを投稿する、スナップショットをする、アルバムからアップロードするなど、さまざまなビデオ投稿モードが開発されている。ビデオの投稿方法は、個々のユーザーが自由に選択することができる。例えば、「中秋節おめでとう」、「誕生日おめでとう」などのメッセージを入力し、それに対応したビデオを生成して投稿したいユーザーもいるだろう。

現在、ビデオ編集アプリは、ビデオへの文字挿入をサポートするために開発されている。しかし、アプリ110のユーザーは、まず、ビデオ編集アプリでビデオを生成して保存し、アプリ110でビデオをアップロードして公開する必要がある。これらの操作は、複数のアプリを含むため複雑で、携帯電話などの画面面積が小さい端末ではユーザーが実装するのは難しい。そのため、情報共有アプリのユーザーにとって、より便利で効果的な方法で文字モードのビデオを生成することが研究のホット話題になっている。

既存の技術的解決策の上記および／または他の欠点を少なくとも部分的に解決するために、本開示の例示的な実施態様に従って、情報共有アプリにおける文字モードビデオを生成するための方法が提案される。この方法では、情報共有アプリのユーザーからビデオ生成の要求を受信し、その後、文字モードでのビデオ生成方法を開始することができる。以下では、本開示による例示的な実装の概要を、本開示の例示的な実装による文字モードでビデオを生成するためのユーザーインターフェース200のブロック図である、図2を参照して説明する。

図1においてユーザーが公開ボタン130を押した後、図2に示すようなユーザーインターフェース200にアクセスすることができる。ユーザーは、本開示の例示的な実装による生成方法を開始するために、ユーザーインターフェース200の底部のメニューで文字モード220を選択することができる。このとき、アプリ110において、ビデオを生成するための初期ページ210が表示されてもよい。この初期ページ210には、「タッチして文字を入力」という文字を入力するためのプロンプトが表示される。ユーザーは、初期ページ210において、対応する文字を入力することができる。例えば、ユーザーは、文字を入力する処理を開始するために、初期ページ210が配置されている領域でタッチ操作を行うことができる。

次に、アプリ110は、ユーザーから文字入力を取得し、その文字入力を含むビデオを生成し、公開する。図2に示されたページレイアウトは、単に概略的なものであり、本開示の例示的な実施態様に従った方法を実施できる限り、他のページレイアウトを使用してもよい。

本開示の例示的な実施態様では、ビデオ編集アプリを別途呼び出す必要がなく、ユーザーは、情報共有アプリ内から直接文字入力に基づいて対応するビデオを生成することができる。これにより、ユーザーの操作の複雑さを軽減し、複数のアプリ間の切り替え時に発生するエラーを回避し、よりリッチな公開コンテンツをユーザーに提供することができる。

以下では、図3を参照して、本開示による例示的な実施態様の詳細を説明する。図3は、本開示の例示的な実施態様による、文字モードでビデオを生成するための方法300のフローチャートを概略的に示す図である。ボックス310において、情報共有アプリのユーザーからビデオ生成の要求を受信する。本開示の例示的な実施態様によれば、ユーザーは、図2に示すように、ユーザーインターフェース200の下部のメニューをスライドして、複数のビデオモードから文字モード220を選択することができる。

図3のボックス320において、情報共有アプリにビデオを生成するための初期ページ210が表示され、ここで、この初期ページ210は、文字を入力するためのプロンプトを含む。本開示の例示的な実施態様によれば、入力プロンプトは、初期ページ内の目立つ場所に表示されてもよい。ユーザーは、プロンプトに従って所望の文字を入力してもよい。例えば、ユーザーは、初期ページ210の任意の空白領域に触れて入力ダイアログボックスを呼び出し、文字を入力することができる。

ボックス330では、初期ページ210が配置されている領域でユーザーのタッチが検出されたことに応答して、ユーザーからの文字入力が取得される。ユーザーは、文字入力に関連して、以下でより詳細に説明するように、文字を入力するために初期ページ210の任意の空白領域をタッチしてもよい（図4参照）。図4は、本開示の例示的な実施態様による、文字を入力するためのユーザーインターフェース400のブロック図を模式的に示している。図4に示すように、ユーザーが初期ページ210の空白領域をタッチした後、文字入力を受け付けるための入力ボックス410がポップアップ表示される場合がある。例えば、ユーザーは「中秋節おめでとう」という平易な文字コンテンツを入力することができる。

本開示の例示的な実施態様によれば、文字入力は、文字及び絵文字を含んでもよい。この場合、ユーザーは「スマイリーフェイス」などの絵文字を入力することもできる。ここでいう絵文字は、携帯端末のオペレーティングシステムによって描かれた絵文字であってもよい、各絵文字が固有のコードを有していてもよい。コードに対して描かれる絵文字の画像は、OSによって異なる場合がある。例えば、2つのOSが描く「スマイリーフェイス」は、口角の上がり具合が異なることがある。

ボックス340では、情報共有アプリで公開するために、文字入力に基づいてビデオが生成される。文字入力が得られた場合、その文字入力を含むビデオを作成し、公開することができる。文字入力は、ビデオを生成するために使用される最も基本的な要素であり、他の要素については、デフォルトのビデオ背景に基づいて、デフォルトの長さのビデオを生成することができる。例えば、アプリ110は、文字の内容に基づいて月夜の背景を選択し、「中秋節おめでとう」の文字を含むビデオを生成してもよい。

本開示の例示的な実装によれば、初期ページ210は、追加のオプションを含んでもよい。以下、図2に戻って、初期ページ210の詳細について説明する。本開示の例示的な実装によれば、初期ページ210は、ビデオ背景を選択するためのオプション234を含んでもよい。ユーザーは、オプション234をクリックして所望のビデオ背景を選択してもよい、例えば、画像、ビデオ、絵文字、および絵文字動画の1つまたはそれ以上が背景として選択されてもよい。ユーザーが選択したビデオの背景をもとにビデオを生成することができる。ユーザーが月餅の画像を選択したと仮定すると、生成されるビデオの背景には月餅の模様が含まれることになる。

本開示の例示的な実施態様によれば、ビデオ背景を選択するためのダイアログボックスにおいて、ビデオ位置、ビデオ枚数、ビデオの軌跡などをさらに指定することができる。ビデオ背景に関する更なる詳細は、本開示の例示的な実施態様によるビデオ背景を選択するためのユーザーインターフェース500のブロック図を概略的に示す図5を参照して説明される。ユーザーは、背景に月餅の画像を選択し、ランダムに配置された3つの画像をビデオに含めるように指定することができる。さらに、画像は、一定方向に動くように指定することも可能である。例えば、運動軌跡は、直線、曲線などのように予め定義されていてもよい、代替的および／または付加的に、運動軌跡は、ランダムに生成されてもよい。本開示の例示的な実装によれば、追加のルールが設定されてもよい。例えば、複数の画像を表示する場合に画像間の衝突を回避することが指定されてもよい。また、例えば、画像が表示境界に到達したときに移動方向を変更することが指定されてもよい、などである。

本開示の例示的な実施態様によれば、背景として機能するようにビデオが選択されてもよい。ある時間期間内でビデオの一部を使用するように指定されてもよい（例えば、開始時刻と終了時刻を指定する）。ビデオの領域が選択される（例えば、あるウィンドウ内で一部を使用するように指定する）、などがある。本開示の例示的な実施態様によれば、絵文字または絵文字動画が、ビデオ背景として選択される。本開示の例示的な実装を用いることで、ビデオを生成するためのリッチな素材を提供することができ、それによって、幅広いユーザーのニーズを満たすことができる。

図2に戻り、初期ページ210に関する詳細について引き続き説明する。本開示の例示的な実施態様によれば、初期ページ210は、文字入力を音読するための音読オプション230を含んでいてもよい、これは、ユーザーがクリックすることによって、作動または非作動させることができる。ユーザーが自動読み上げ機能を起動すると、アプリ110は、ユーザーが入力した文字を人工知能技術に基づいて、自動的に読み上げ、読み上げられた音声に基づいて、ビデオを生成してもよい。このとき、生成されたビデオは、読み上げられた音声を含んでもよく、代替的および／または追加的に、生成されたビデオは、文字コンテンツと音声コンテンツの両方を含んでもよい。

本開示の例示的な実施態様によれば、読み上げオプションは、読み手の性別、年齢、声のスタイル、及び話す速度のうちの少なくとも1つを含んでもよい。このように、ユーザーは、性別や年齢が異なる読者を選択することができる。本開示の例示的な実装によれば、異なるユーザーのニーズを満たすために、様々な音声スタイルが提供される。例えば、声のスタイルは、まろやか、甘い、活き活き、などが考えられるが、これらに限らない。ユーザーは、読み上げ効果の個人化をサポートするために、高速、中速、低速の異なる音声速度を選択することができる。

本開示の例示的な実施態様によれば、ユーザーは、読み上げオプションを非作動にすることができ、生成されたビデオは文字コンテンツのみを含む。本開示の例示的な実施態様によれば、ユーザーは、ビデオを生成するための様々な材料を提供することができ、したがって、よりリッチなメディアプレゼンテーションを提供することができる。

以上、添付図を参照しながら、初期ページ210の内容を説明した。ユーザーは、ビデオを生成するための各種パラメータを定義するために、初期ページ210において設定を行うことができる。ユーザーは、初期ページ210での設定を確認したら、編集ページを表示するために、「次へ」ボタン232をクリックすることができる。以下では、本開示の例示的な実施態様によるビデオを編集するためのユーザーインターフェース600のブロック図である図6において、編集ページに関するより詳細な説明を行う。ユーザーは、編集ページ610においてアクションを実行してもよい、アプリ110は、編集ページ610におけるユーザーのアクションに基づいて、対応するビデオを生成してもよい。

本開示の例示的な実施態様によれば、編集ページ610は、読み上げ設定を編集するためのオプション620、文字入力を編集するためのオプション622、及び、ビデオ背景を編集するためのオプション624のうちの少なくとも1つを含むことができる。622は、既に入力されている文字の編集、フォント、フォントサイズ、色、表示位置などの設定、オプション624は、既に選択されている背景の編集、背景の再選択、新規追加などの設定を行う。

所望のパラメータを編集したので、ユーザーは、「次へ」ボタン640を押して、編集ページ610でユーザーが指定した編集済みオプションに基づいて、対応するビデオを生成することができる。本開示の例示的な実装を用いると、編集ページ610は、様々なパラメータを修正する能力をユーザーに提供する。このように、ユーザーが満足できない場合、以前の設定を修正するチャンスを提供することで、ユーザーの操作を容易にし、満足するビデオを生成することができる。

本開示の例示的な実施態様によれば、編集ページ610は、ビデオに追加する背景音を選択するためのオプション630を含む。背景音は、BGMおよび／またはキャラクタナレーションなどの他のサウンドを含む。例えば、ユーザーは、オプション630を押して、ビデオのBGMやその他の音声を選択することができる。任意かつ／あるいは追加で、ユーザーがナレーションを録音してもよい。例えば、ユーザーが中秋節に関する詩を朗読する、など。

ユーザーが所望の背景音を選択した後、アプリ110は、ユーザーアクションによって指定された背景音に基づいて、対応するビデオを生成してもよい。本開示の例示的な実装を使用して、ユーザーは、よりリッチなビデオコンテンツを生成するために、より多様なサウンドファイルをビデオに追加することを許可されてもよい。

本開示の例示的な実施態様によれば、編集ページ610は、ビデオに追加するステッカーを選択するためのオプション632をさらに備えてもよい。ステッカーは、画像ステッカーだけでなく文字ステッカーも含む。文字ステッカーは、例えば、様々な芸術的なフォントで書かれた一般的なフレーズなどの文字を含む。画像ステッカーは、アイコンや一般的な表現、フォトフレームなどを使用できる。ユーザーは、オプション632を押してビデオにステッカーを挿入することができ、例えば、文字ステッカー「家族の絆」、画像ステッカー「レッドハート」、等を挿入することができる。さらに、ユーザーは、タッチ、ドラッグ、回転、拡大縮小などにより、ステッカーの位置、大きさ、向きを調整することができる。

ユーザーが所望のステッカーを選択した後、アプリ110は、指定されたステッカーに対するユーザーの操作に基づいて、対応するビデオを生成することができる。本開示の例示的な実装を使用して、ユーザーは、よりパーソナライズされた要素をビデオに追加することができる。こうすることで、ビデオの面白さが増し、豊かなメディア表現が可能になる。

本開示の例示的な実施態様によれば、編集ページ610は、以下のものを含むことができる。ビデオの長さを指定するためのオプション。ビデオの長さは、例えば3秒（または他の値）をデフォルトとすることができる。より良いカスタマイズを提供するために、ユーザーは、ビデオの長さをカスタマイズできる。さらに、ユーザーが背景音（またはビデオ）を選択する際に、背景音（またはビデオ）とビデオの長さのマッチング関係を設定できる。デフォルトでは、ビデオの長さに合わせたサウンド（またはビデオ）クリップを背景音から取り出すことができる。ユーザーが指定した長さが背景音（またはビデオ）の長さより大きい場合、ユーザーは、ループを再生するように設定することができる。任意および／または追加的に、生成されるビデオの長さは、背景音（またはビデオ）の長さに基づいて設定することができる。

ユーザーが所望の長さを選択した後、ユーザー操作によって指定された長さに基づき、対応するビデオを生成してもよい。本開示の例示的な実装を使用すると、ユーザーは、ビデオ生成のさらなるパラメータを調整することができ、その結果、ユーザーが満足するビデオ構成を生成することが容易になる。

本開示の例示的な実施態様によれば、編集ページ610は、文字入力及びビデオ背景の少なくとも1つのための動画モードを指定するためのオプションを含む。ここでいう動画モードは、文字入力とビデオ背景の表示方法を複数含んでいてもよい。例えば、文字入力の動画モードは、文字入力をフェード、モーショントラック方式で表示するように指定することができる。

本開示の例示的な実施態様によれば、ビデオ背景の動画モードは、背景を表示する方法を指定することができる。ビデオ背景が画像の場合、動画モードは、表示領域、画像数、表示方法（リトラクタブル表示、タイル表示）、表示軌跡、などを指定することができる。背景がビデオの場合、ビデオモードでは、生成するビデオの背景となるビデオの部分や、ビデオの背景と生成するビデオの解像度の関係、などを指定することができる。ビデオの背景が絵文字（または絵文字動画）の場合、生成するビデオに含める絵文字の数、絵文字の表示位置、移動の軌跡などを指定することができる。

さらに、ユーザーアクションによって指定されたビデオパターンに基づいて、対応するビデオを生成することもできる。ユーザーが、文字入力を画面上部から下に向かって循環させ、背景に含まれる3つの画像を、それぞれランダムに選択した直線方向に移動し、表示領域の境界に到達すると移動方向を変えるように指定できる。この時点で、図7のようなビデオが出来上がる。図7は、本開示の例示的な実施態様による、ビデオをプレビューするためのユーザーインターフェース700のブロック図である。図7において、文字入力は、矢印720で示す方向に移動し、表示領域の下部から移動した後、表示領域の上部に再表示されるなど、3つの画像510、512、514は、ランダムに選択された直線方向に移動することができる。例えば、画像512は、方向710に沿って移動し、表示領域の境界線に到達すると移動をリダイレクトすることができる。

本開示の例示的な実装によれば、所定のデフォルトビデオモードが提供されてもよい。その時点で、ユーザーは、ビデオ表示に関する各パラメータを個別に選択する必要はなく、代わりに、直接選択可能な静的背景画像からダイナミックビデオを生成することができる。一例として、背景画像のデフォルトのビデオモードは、3つの画像を表示し、画像は、ビデオ内で飛び回ることを指定することができる。この場合、ユーザーが月餅の絵柄を選択すると、生成されるビデオには3つの月餅の絵柄が飛び出すエフェクトが含まれることになる。任意かつ／あるいは追加的に、別のデフォルトビデオモードでは、1枚の画像を表示し、その画像をビデオ内で回転させることを指定してもよい。この場合、出来上がったビデオには、月餅の模様が回転する動画が含まれる。別の例では、文字入力のデフォルトのビデオモードは、文字入力がビデオの中央に表示されるように指定することができる。

本開示の例示的な実装を用いると、静的な文字入力に基づいて動的なビデオ画面を生成することができる。このように、よりリッチな視覚表現をユーザーに提供することで、さまざまなユーザーのニーズに応えることができる。

本開示の例示的な実装によれば、ユーザーからビデオを投稿するための要求を受信した場合、ビデオは、情報共有アプリに投稿される。本開示の例示的な実施態様によれば、ユーザーが編集ページ610における操作を完了した後、ビデオを生成するために「次へ」ボタン640が押される。ここでのビデオは、アプリ110がサポートする様々なフォーマットのうちのいずれかのビデオファイルであり得る。本開示の例示的な実施態様では、文字モードビデオを単一のアプリで生成し、公開することができる。上記の方法により、ビデオ編集アプリと情報共有アプリを切り替える既存の技術的解決策に比べ、アプリを切り替えることなく、よりシンプルかつ効率的にビデオの生成と配信を行うことができる。

本開示の例示的な実装によれば、ユーザーによって入力された文字および／または選択された背景画像が、端末装置に依存する絵文字を含む場合、絵文字のコードは、ビデオと関連して格納される。端末装置のOSが異なる場合、絵文字の描画に差異が生じる可能性がある。ユーザーが絵文字「スマイリーフェイス」を入力し、そのコードが「001」であったと仮定すると、「001」というコードは、ビデオコンテンツではなく、直接格納することができるユーザーの端末のOSが描画する絵文字を追加するのではなく、ビデオコンテンツに直接「001」というコードを格納することができる。このように、生成されたビデオを他のユーザーが再生すると、他のユーザーの端末装置のOSの種類に応じて、対応する「スマイリーフェイス」をビデオ内に表示することができる。本開示の例示的な実施態様により、複数のオペレーティングシステムにわたって、より多くの選択肢をユーザーに提供することが可能である。

本開示の例示的な実施態様による方法300の詳細は、図1～図7を参照して上述した通りである。本開示の例示的な実施態様によれば、上記の方法又はプロセスを実施するための更なる対応する装置が提供される。図8は、本開示の例示的な実施態様による、文字モードでビデオを生成するための装置800のブロック図を概略的に示す。具体的には、装置800は、情報共有アプリのユーザーからビデオを生成するための要求を受信するように構成された受信モジュール810と、情報共有アプリにおいて、ビデオを生成するための初期ページを表示するように構成された表示モジュール820と、初期ページが文字入力用のプロンプトを含む、フェッチモジュール830と、ユーザーがタッチし、ユーザーから文字入力を取得して、情報共有アプリに投稿するために、文字入力に基づいてビデオを生成するように構成された生成モジュール840を備える。

本開示の例示的な実施態様によれば、初期ページは、ビデオ背景を選択するためのオプションを含み、生成モジュール840は、ユーザーによって選択されたビデオ背景を受け取ることに応答して、ビデオ背景に基づいてビデオを生成し、ビデオ背景は、画像、ビデオ、絵文字、および絵文字動画の少なくともいずれかを含むように構成されている。

本開示の例示的な実施態様によれば、初期ページは、文字入力を音読するための音読オプションを含む。生成モジュール840は、音読オプションのユーザー選択を受信することに応答して、文字入力の音声の音読に基づいてビデオを生成することを含む。

本開示の例示的な実施態様によれば、読み上げオプションは、読み手の性別、年齢、音声スタイル、及び発話速度のうちの少なくとも1つを含む。

本開示の例示的な実施態様によれば、生成モジュール840は、さらに、以下のように構成される。ユーザーによる音読オプションの選択の取り消しを受け取ることに応答して、文字入力に基づいてビデオを生成すること。

本開示の例示的な実施態様によれば、生成モジュール840は、初期ページを確認するユーザーを検出することに応答して、情報共有アプリにおいてビデオを生成するための編集ページを表示するように構成された編集ページ表示モジュールを含み、生成モジュール840は、編集ページにおけるユーザーによるユーザーアクションに基づいてビデオを生成するように構成されたビデオ生成モジュールを含む。

本開示の例示的な実施態様によれば、編集ページは、文字入力、ビデオ背景、及び読み上げオプションの少なくとも1つを編集するためのオプションを備え、ビデオ生成モジュールは、ユーザーアクションによって指定された編集されたオプションに基づいてビデオを生成するために構成される。

本開示の例示的な実施態様によれば、編集ページは、ビデオに背景音を追加するためのオプションを選択するためのオプションを備え、ビデオ生成モジュールは、ユーザーアクションによって指定された背景音に基づいてビデオを生成するために構成される。

本開示の例示的な実施態様によれば、編集ページは、ビデオに追加するステッカーを選択するためのオプションを備え、ビデオ生成モジュールは、ユーザーアクションによって指定されたステッカーに基づいてビデオを生成し、ステッカーは、画像ステッカーの他に文字ステッカーも含むように構成される。

本開示の例示的な実施態様によれば、編集ページは、ビデオの長さを指定するためのオプションを備え、ビデオ生成モジュールは、ユーザー操作によって指定された長さに基づいてビデオを生成するために構成される。

本開示の例示的な実施態様によれば、編集ページは、文字入力及びビデオ背景の少なくとも一方のビデオモードを指定するためのオプションを備え、ビデオ生成モジュールは、ユーザー操作により指定されたビデオモード又は所定のビデオモードに基づいて、ビデオを生成するために構成される。

本開示の例示的な実施態様によれば、文字入力は、絵文字からなり、生成モジュール840は、ビデオを再生するために使用される端末装置の種類に応じて、コードに対応する絵文字を表示するための絵文字のコードをビデオと関連付けて記憶するように構成された絵文字記憶モジュールを備える。

本開示の例示的な実施態様によれば、装置800は、ビデオを公開するためのユーザーからの要求に応答して、情報共有アプリにおいてビデオを公開するように構成された公開モジュールを備える。

本開示の例示的な実装によれば、装置800に含まれるユニットは、ソフトウェア、ハードウェア、ファームウェア、または、それらの任意の組み合わせを含む様々な手段を使用して実装される。いくつかの実装では、1つ以上のユニットは、記憶媒体に格納された機械実行可能な命令などのソフトウェアおよび/またはファームウェアを使用して実装される場合がある。機械実行可能な命令に加え、または、その代替として、装置800のユニットの一部または全部は、1つまたは複数のハードウェア論理コンポーネントによって、少なくとも部分的に実装されてもよい。限定ではなく、例として、使用されるハードウェア論理コンポーネントの例示的なタイプには、フィールドプログラマブルゲートアレイ（FPGA）、特定用途向け集積回路（ASIC）、特定用途向け汎用品（ASSP）、システムオンチップ（SOC）、複合プログラマブル論理デバイス（CPLD）、および、同様のものが含まれる。

図9は、本開示の1つ以上の実装が実装されるコンピューターデバイス／サーバー900のブロック図である。図9に例示されたコンピューターデバイス／サーバー900は、単に例示的なものであり、本説明書に記載された実装の機能および範囲に対するいかなる限定も構成すべきではない。

図9に示すように、コンピューターデバイス／サーバー900は、汎用コンピューターデバイスの形態である。コンピューターデバイス／サーバー900の構成要素は、1つ以上のプロセッサーまたは処理ユニット910、メモリ920、ストレージデバイス930、1つ以上の通信ユニット940、1つ以上の入力デバイス950、および、1つ以上の出力デバイス960を含むが、これらに限定されない。処理ユニット910は、実際のまたは仮想プロセッサーであり、メモリ920に格納されたプログラムに基づいて種々の処理を行うことが可能である。処理ユニット910は、実際のプロセッサーであっても仮想プロセッサーであってもよく、メモリ920に格納されたプログラムに基づいて様々な処理を行うことが可能である。マルチプロセッサーシステムでは、複数の処理装置が、コンピューター実行可能な命令を並列に実行し、コンピューターデバイス／サーバー900の並列処理能力を向上させる。

コンピューターデバイス／サーバー900は、典型的には、複数のコンピューター記憶媒体を含む。そのようなメディアは、揮発性メディアおよび不揮発性メディア、取り外し可能メディア、および取り外し不可能メディアを含むが、これらに限定されない、コンピューターデバイス／サーバー900は、アクセス可能な任意のメディアであってよい。メモリ920は、揮発性メモリ（例えば、レジスタ、キャッシュ、ランダムアクセスメモリ（RAM））、不揮発性メモリ（例えば、読み取り専用メモリ（ROM）、電気的消去可能プログラマブル読み取り専用メモリ（EEPROM）、フラッシュメモリ）、または、それらのいくつかの組み合わせであってもよい。ストレージデバイス930は、取り外し可能または取り外し不可能な媒体であってもよい、フラッシュドライブ、ディスク、または、情報および／またはデータ（例えば、トレーニングのためのトレーニングデータ）を格納するために使用することができ、計算装置／サーバー900内でアクセス可能な任意の他の媒体などの機械可読媒体を含むことができる。

計算装置／サーバー900は、追加の取り外し可能／取り外し不可能な、揮発性／不揮発性の記憶媒体をさらに含んでいてもよい。図9には図示していないが、リムーバブルな不揮発性ディスク（例えば、「フロッピー（登録商標）ディスク」）からの読み出しや書き込みを行うディスクドライブ、リムーバブルな不揮発性光ディスクからの読み出しや書き込みを行う光ディスクドライブを設けてもよい。このような場合、各ドライブは、1つ以上のデータメディアインターフェースによって、バス（図示せず）に接続することができる。メモリ920は、本開示の様々な実装の様々な方法又は動作を実行するように構成された1つ又は複数のプログラムモジュールを有するコンピュータープログラム製品925を含む。

通信ユニット940は、通信媒体を介して他のコンピューター装置との通信を実施する。さらに、コンピューターデバイス／サーバー900の構成要素の機能は、通信接続を介して通信可能な単一のコンピュータークラスタまたは複数のコンピューターマシンとして実装されてもよい。したがって、コンピューターデバイス／サーバー900は、1つ以上の他のサーバー、ネットワーク化されたパーソナルコンピューター（PC）、または、他のネットワークノードへの論理接続を用いて、ネットワーク化された環境で動作することができる。

入力デバイス950は、マウス、キーボード、トラッキングボールなどの1つまたは複数の入力デバイスであってもよい。出力デバイス960は、モニター、スピーカ、プリンタなどの1つ以上の出力デバイスであってもよい。コンピューターデバイス／サーバー900は、また、通信ユニット940を介して、必要に応じて、1つ以上の外部デバイス（図示せず）、記憶装置、ディスプレイデバイスなどの外部デバイス、ユーザーがコンピューターデバイス／サーバー900と対話できるようにする1つ以上のデバイス、または、コンピューターデバイス／サーバー900が1つ以上の他のコンピューターと通信できるようにする任意のデバイスと通信してもよい。デバイス（例えば、ネットワークカード、モデムなど）。このような通信は、入出力（I/O）インターフェース（図示せず）を介して行われてもよい。

本開示の例示的な実施態様に従って、1つ以上のコンピューター命令が格納されたコンピューター可読記憶媒体が提供され、コンピューター命令の1つ以上がプロセッサーによって実行されて、上述した方法を実施することが可能である。

本開示の態様は、本開示に従って実装される方法、装置（システム）、及びコンピュータープログラム製品のフローチャートおよび／またはブロック図を参照して、本説明書において説明される。フローチャートおよび／またはブロック図の各ボックス、ならびに、フローチャートおよび／またはブロック図のボックスの組み合わせは、コンピューター可読プログラム命令によって実施される。

これらのコンピューター可読プログラム命令は、汎用コンピューター、特殊用途コンピューター、または、他のプログラム可能なデータ処理装置の処理装置に提供することができ、それによって、これらの命令がコンピューターまたは他のプログラム可能なデータ処理装置の処理装置を介して実行されたとき、フローチャートおよび／またはブロック図の1つまたは複数のボックスで指定された機能／動作を実施する装置を生成するような機械を生成することができる。また、これらのコンピューター可読プログラム命令を、コンピューター、プログラム可能なデータ処理装置、および／または、他の装置を特定の方法で動作させるコンピューター可読記憶媒体に格納することも可能であり、これにより、命令が格納されたコンピューター可読媒体は、次に、フローチャートおよび／またはブロック図のボックスの1つ以上に規定される機能／アクションの態様を実施するための命令を含む製造品から構成される。

コンピューター、他のプログラム可能なデータ処理デバイス、または、他のデバイス上で実行される命令がフローチャートを実装するようなコンピューター実装のプロセスを生成するために、一連の動作ステップが、コンピューター、他のプログラム可能なデータ処理デバイス、または他のデバイス上にコンピューター可読プログラム命令をロードすることも可能であり、かつ／あるいはブロックダイアグラムの一つ以上のボックスで指定された機能/アクションを実現させる。

添付図のフローチャートおよびブロック図は、本開示によるシステム、方法、およびコンピュータープログラム製品の複数の実装のアーキテクチャ、機能性、および動作の可能な実装を示すものである。この時点で、フローチャートまたはブロック図の各ボックスは、モジュール、プログラムセグメント、または命令の一部を表すことができ、モジュール、プログラムセグメント、または命令の一部は、特定の論理機能を実行するための1つまたは複数の実行可能命令を含んでいる。代替品としてのいくつかの実装では、ボックス内に示された機能は、添付図に示されたものとは異なる順序で発生することもある。例えば、連続する2つのボックスは、実際には、実質的に並行して実行されることがあり、関係する機能によっては、逆の順序で実行されることもある。また、ブロック図および／またはフローチャートの各ボックス、および、ブロック図および／またはフローチャートのボックスの組み合わせは、所定の機能または動作を実行する専用のハードウェアベースのシステムで実装することができ、または、専用のハードウェアとコンピューター命令の組み合わせで実装できることに注目することが重要である。

以上、本開示の様々な実施態様を説明したが、前述の説明は、例示的であり、網羅的ではなく、開示された様々な実施態様に限定されるものではない。多くの修正および変更は、図示された様々な実施態様の範囲および精神から逸脱することなく、この技術分野の当業者にとって分かりやすい。本説明書で使用される用語は、各実施態様の市場における技術の原理、実用化、または改良を最もよく説明するため、あるいは、当業者が本説明書に開示された実施態様を理解できるように選択されたものである。

Claims

情報共有アプリにおいて、文字モードでビデオを生成するための方法であって、
前記情報共有アプリのユーザーから前記文字モードでビデオを生成するための要求を受信することであり、前記文字モードは、静的な文字入力に基づいて動的なビデオ画面を生成するために使用されていること、
前記情報共有アプリにおいて、前記ビデオを生成するための初期ページを表示することであり、前記初期ページは文字を入力するためのプロンプトを含んでいること、
前記初期ページが配置された領域で前記ユーザーのタッチが検出されたことに応答して、前記ユーザーから前記情報共有アプリにおける文字入力を取得すること、および、
前記情報共有アプリにおける前記文字入力に基づいて、前記情報共有アプリで公開される前記ビデオを生成すること、
を含む、方法。
前記初期ページは、ビデオ背景を選択するためのオプションを含み、かつ、
前記ビデオを生成することは、前記ユーザーによって選択されたビデオ背景を受信することに応答して、前記ビデオ背景に基づいてビデオを生成すること、を含み、
前記ビデオ背景は、画像、ビデオ、絵文字、および表情動画のうちの少なくとも1つを含む、
請求項１に記載の方法。
前記初期ページは、前記文字入力を読み上げるための読み上げオプションを含み、かつ、
前記ビデオを生成することは、前記ユーザーによる読み上げオプションの選択の受信に応答して、前記文字入力の読み上げ音声に基づいてビデオを生成すること、を含む、
請求項１に記載の方法。
前記読み上げオプションは、読み上げ者の性別、年齢、声色、および話速のうちの少なくとも1つを含む、
請求項３に記載の方法。
前記ビデオを生成することは、前記ユーザーが前記読み上げオプションを非作動にしたことに応答して、前記文字入力のみに基づいてビデオを生成すること、を含む、
請求項３に記載の方法。
前記ビデオを生成するステップは、
前記ユーザーが前記初期ページを確認したことを検出したことに応答して、アプリを生成するための編集ページを情報共有ビデオに表示するステップを含み、
前記ビデオは、前記編集ページに対する前記ユーザーのユーザー操作に基づいて生成される、
請求項１に記載の方法。
前記編集ページは、文字入力、ビデオ背景、および読み上げオプションのうちの少なくとも1つを編集するためのオプションを含み、かつ、
前記ユーザー操作に基づいて前記ビデオを生成することは、前記ユーザー操作により指定された編集後の選択肢に基づいて前記ビデオを生成すること、を含む、
請求項６に記載の方法。
前記編集ページは、前記ビデオに背景音を付加することを選択するためのオプションを含み、かつ、
前記ユーザー操作に基づいて前記ビデオを生成することは、前記ユーザー操作により指定された前記背景音に基づいて前記ビデオを生成すること、を含む、
請求項６に記載の方法。
前記編集ページは、前記ビデオにステッカーを追加することを選択するためのオプションを含み、かつ、
前記ユーザー操作に基づいて前記ビデオを生成することは、前記ユーザー操作により指定された前記ステッカーに基づいて前記ビデオを生成すること、を含み、
前記ステッカーは、文字ステッカーおよび画像ステッカーを含む、
請求項６に記載の方法。
前記編集ページは、前記ビデオの長さを指定するオプションを含み、かつ、
前記ユーザー操作に基づいて前記ビデオを生成することは、前記ユーザー操作で指定された長さに基づいて前記ビデオを生成すること、を含む、
請求項６に記載の方法。
前記編集ページは、前記文字入力および前記ビデオの背景の少なくとも一方のビデオモードを指定するオプションを含み、かつ、
前記ユーザー操作に基づいて前記ビデオを生成することは、前記ユーザー操作により指定されたビデオモード又は所定のビデオモードに基づいて前記ビデオを生成すること、を含む、
請求項６に記載の方法。
前記文字入力が絵文字を含み、かつ、
前記ビデオを生成することは、前記ビデオを再生するために使用される端末装置の種類に応じて、コードに対応する絵文字を表示するための前記絵文字のコードを前記ビデオに関連付けて記憶すること、を含む、
請求項１に記載の方法。
前記ビデオを公開するためのユーザーからの要求に応じて、前記情報共有アプリに公開することを、含む、
請求項１に記載の方法。
情報共有アプリにおいて、文字モードでビデオを生成するためのデバイスであって、
前記情報共有アプリのユーザーから前記文字モードでビデオを生成するための要求を受信するように構成されており、前記文字モードは静的な文字入力に基づいて動的なビデオ画面を生成するために使用されている、受信モジュールと、
前記情報共有アプリにおいて、前記ビデオを生成するための初期ページを表示するように構成されており、前記初期ページは文字を入力するためのプロンプトを含んでいる、表示モジュールと、
前記初期ページが配置された領域において前記ユーザーのタッチが検出されたことに応答して、前記ユーザーから前記情報共有アプリにおける文字入力を取得するように構成されている、取得モジュールと、
前記情報共有アプリにおける前記文字入力に基づいて、前記情報共有アプリで公開される前記ビデオを生成するように構成されている、生成モジュールと、
を含む、デバイス。
電子デバイスであって、
メモリと、プロセッサーと、を含み、
前記メモリは、１つ以上の命令をストレージするために使用され、
前記命令が前記プロセッサーによって実行されると、請求項１乃至１３いずれか一項に記載の方法をコンピューターに実施させる、
電子デバイス。
コンピューター可読メモリ媒体であって、
1つ以上のコンピューター命令がストレージされており、
コンピューターによって前記コンピューター命令が実行されると、
請求項１乃至１３いずれか一項に記載の方法を前記コンピューターに実施させる、
コンピューター可読メモリ媒体。