JP7732004B2 - ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品 - Google Patents

ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品

Info

Publication number
JP7732004B2
JP7732004B2 JP2023578709A JP2023578709A JP7732004B2 JP 7732004 B2 JP7732004 B2 JP 7732004B2 JP 2023578709 A JP2023578709 A JP 2023578709A JP 2023578709 A JP2023578709 A JP 2023578709A JP 7732004 B2 JP7732004 B2 JP 7732004B2
Authority
JP
Japan
Prior art keywords
target
fragment
clipping
multimedia data
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023578709A
Other languages
English (en)
Other versions
JP2024528440A (ja
Inventor
リ,シンウェイ
ツァオ,ジィアジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Publication of JP2024528440A publication Critical patent/JP2024528440A/ja
Application granted granted Critical
Publication of JP7732004B2 publication Critical patent/JP7732004B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

[関連出願]
本出願は、2022年5月10日に出願され、発明名称「ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品」、出願番号202210508063.2の中国特許出願の優先権を主張する。
[技術分野]
本開示は、ビデオ処理の技術分野に関し、特に、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品に関する。
コンピュータ技術及びモバイル通信技術の急速な発展に伴い、電子機器をベースとする様々なビデオプラットフォームが一般的に使用されるようになり、人々の日常生活を大いに豊かにしている。自分のビデオ作品をビデオプラットフォームで共有し、他のユーザに見てもらうことを喜ぶユーザがますます増えている。
関連技術では、ビデオを作成する場合、ユーザはまずビデオに必要なあらゆる種類の素材を自分で探し出し、その素材に対して一連の複雑なビデオクリッピング操作を行い、最終的にビデオ作品を生成する必要がある。
ユーザはクリッピング経験が不足している場合、ビデオの作成時間コストの増加につながり、かつ作成されたビデオ品質も低くなる。
上記技術的問題を解決するために、本開示の実施例は、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。
第1態様によれば、本開示の実施例はビデオ生成方法を提供し、この方法は、
受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、
ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、
ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。
第2態様によれば、本開示の実施例はビデオ生成装置を提供し、この装置は、
受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、
クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るためのターゲットマルチメディアデータ生成モジュールと、
ターゲットマルチメディアデータに基づいてターゲットビデオを生成するためのターゲットビデオ生成モジュールと、を備える。
第3態様によれば、本開示の実施例は電子機器を提供し、前記電子機器は、
1つまたは複数のプロセッサと、
1つまたは複数のプログラムを記憶するための記憶装置と、を備え、
1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに上記第1側面のいずれか1項に記載のビデオ生成方法を実行させる。
第4態様によれば、本開示の実施例は、コンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供し、前記プログラムがプロセッサによって実行されると、上記第1態様のいずれか1項に記載のビデオ生成方法を実行させる。
第5態様によれば、本開示の実施例は、コンピュータプログラムまたは命令を含むコンピュータプログラム製品を提供し、前記コンピュータプログラムまたは命令がプロセッサによって実行されると、上記第1態様のいずれか1項に記載のビデオ生成方法を実行させる。
本開示の実施例は、ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、前記方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。本開示の実施例では、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。
添付図面と併せて、以下の具体的な実施形態を参照して、本開示の各実施例の上記および他の特徴、利点および態様をより明らかにする。添付図面全体を通して、同一または類似の符号は、同一または類似の要素を示す。なお、添付図面は概略図であり、実物および要素は必ずしも縮尺通りに描かれていないことを理解されたい。
本開示の実施例が提供するビデオ作成シナリオのアーキテクチャ図である。 本開示の実施例中のビデオ生成方法の概略フローチャートである。 本開示の実施例中のテンプレートテーマコントロールのトリガーの概略図である。 本開示の実施例中のテンプレートコントロールのトリガーの概略図である。 本開示の実施例中のテンプレート適用プロンプトの概略図である。 本開示の実施例中のビデオ生成装置の概略構造図である。 本開示の実施例中の電子機器の概略構造図である。
以下、添付図面を参照しながら本開示の実施例をより詳細に説明する。添付図面に本開示のいくつかの実施例が図示されているが、本開示は様々な形態で実現され得、本明細書に記載された実施例に限定されなく、むしろ、これらの実施例は、本開示のより徹底的かつ完全な理解のために提供されることを理解されたい。なお、本開示の添付図面および実施例は例示的な目的でのみ使用され、本開示の保護範囲を限定することを意図するものではないことを理解されたい。
なお、本開示の方法実施形態に記載された各ステップは異なる順序で、および/または並行して実行されてもよい。さらに、方法実施形態は、追加のステップを含み、および/または図示されたステップの実行を省略してもよい。本開示の範囲はこの点において特に限定されない。
本明細書で使用される用語「含む」およびその変形は開放的であり、すなわち「含むが、これに限定されない」を意味する。用語「に基づく」は、「少なくとも一部に基づく」を意味する。用語「一実施例」は「少なくとも1つの実施例」を意味し、用語「別の実施例」は「少なくとも1つの他の実施例」を意味し、用語「いくつかの実施例」は「少なくともいくつかの実施例」を意味する。他の用語の関連する定義は以下の説明において示される。
なお、本開示で言及される「第1」、「第2」などの概念は、異なる装置、モジュールまたはユニットを区別するために使用され、これらの装置、モジュールまたはユニットによって実行される機能の順序または相互依存性を定義するために使用されないことに留意されたい。
なお、本開示で言及される「1つ」、「複数」の修飾は、限定的ではなく例示的なものであることに留意されたく、当業者は、文脈上別段の明示がないかぎり、「1つまたは複数」と理解されるべきであることを理解されたい。
本開示の実施形態における複数の装置間で相互作用するメッセージまたは情報の名称は、例示的な目的でのみ使用され、これらのメッセージまたは情報の範囲を限定することを意図していない。
本出願の実施例を詳細に説明する前に、まず本出願の実施例の適用シナリオを説明する。
ユーザがドキュメントを扱う場合、テキストの形式で提示されることがほとんどであり、ユーザがテキストを読むのは手間がかかるため、テキスト情報をビデオに変換することで、ユーザがテキストを解読するのに苦労することなく、音声を聞きながらビデオ画面を見ることで、記事で伝えられている情報を明確にすることができ、ユーザの情報取得の難易度を下げることができる。または、文章が長く、ユーザが文章を読むのに手間がかかるため、1つ1つ読む気力がないため、記事をビデオに変換し、ビデオを通して記事で伝えられている情報を素早く理解し、その後、記事の中から自分の興味のあるものを選んでじっくり読む。また、ビデオの表現形式は多様化されているため、退屈な文章を読むのに比べ、ユーザの関心を引きやすく、ユーザはこの方法で記事を読むことに積極的になる。
関連技術では、テキストデータからキーワードを抽出し、各キーワードについて、所定の画像ライブラリからキーワードに一致するビデオ画像を検索し、タイポグラフィ規則に従ってテキスト情報およびビデオ画像を合成して、ターゲットビデオを得る必要がある。しかし、関連技術中、検索されたビデオ画像とテキストデータとの単純な合成のみが行われ、作成されたビデオの品質が高くなく、その後、ユーザはビデオを手動でクリッピングする必要があり、ユーザはクリッピング経験が不足している場合、ビデオの品質に影響を与える。
本出願の実施例では、テキストデータに基づいて初期マルチメディアデータを生成した後、1つのターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、初期マルチメディアデータのクリッピング処理を実現し、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。図1は、本開示の実施例が提供するビデオ作成シナリオのアーキテクチャ図を示す。
図1に示すように、前記アーキテクチャ図は、クライアントの少なくとも1つの電子機器101およびサーバーの少なくとも1つのサーバー102を含み得る。電子機器101は、ネットワークプロトコル、例えばハイパー・テキスト・トランスファー・プロトコル(Hyper Text Transfer Protocol over Secure Socket Layer, HTTPS)を介して、接続を確立し、サーバー102と対話する。ここで、電子機器101は、携帯電話、タブレットコンピュータ、デスクトップパソコン、ノートパソコン、車載端末、ウェアラブルデバイス、オールインワンコンピュータ、スマートホームデバイスなどの通信機能を備えた装置、または仮想マシンやシミュレータによってシミュレートされた装置を含んでもよい。サーバー102は、クラウドサーバーまたはサーバークラスタなど、記憶や演算機能を有する装置を含んでもよい。
上記アーキテクチャに基づいて、ユーザは、電子機器101上の指定されたプラットフォーム内でビデオを作成することができ、指定されたプラットフォームは、指定されたアプリケーションプログラムまたは指定されたウェブサイトであってもよい。ユーザはビデオを作成した後、指定プラットフォームのサーバー102に該ビデオを送信し、サーバー102は電子機器101から送信されたビデオを受信し、受信したビデオを記憶し、該ビデオを再生する必要のある電子機器に該ビデオを送信することができる。
本開示の実施例では、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させるために、電子機器101は、初期マルチメディアデータに対するユーザのクリッピングテンプレート取得要求を受信し、電子機器101が該クリッピングテンプレート取得要求を受信した後、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成することができる。このように、ターゲットビデオの生成過程で取得されたターゲットクリッピングテンプレート中のクリッピング操作を初期マルチメディアデータに直接適用することにより、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。
選択可能に、上記アーキテクチャに基づいて、電子機器101はクリッピングテンプレート取得要求を受信してターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成することにより、電子機器101はローカルでターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットビデオを生成し、ビデオの作成時間コストをさらに削減する。
選択可能に、上記アーキテクチャに基づいて、電子機器101はクリッピングテンプレート取得要求を受信した後、サーバー102にテンプレート識別子を含むクリッピングテンプレート取得要求を送信することもできる。サーバー102は電子機器101から送信されたテンプレート識別子を含むクリッピングテンプレート取得要求を受信した後、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得、ターゲットマルチメディアデータに基づいてターゲットビデオを生成し、電子機器101に生成されたターゲットビデオを送信し、電子機器101は、サーバー102に対して、クリッピングテンプレート取得要求に基づいて、ターゲットクリッピングテンプレートを取得し、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットビデオを生成するように要求することができ、作成されたビデオ品質をさらに向上させ、電子機器101のデータ処理量を削減することもできる。
例えば、電子機器は、モバイル端末、固定端末またはポータブル端末、例えば携帯電話、ステーション、ユニット、デバイス、マルチメディアコンピュータ、マルチメディアタブレット、インターネットノード、コミュニケータ、デスクトップパソコン、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、パーソナル通信システム(PCS)装置、パーソナルナビゲーション装置、パーソナルデジタルアシスタント(PDA)、オーディオ/ビデオプレーヤ、デジタルカメラ/カムコーダ、測位装置、テレビ受信機、ラジオ放送受信機、電子書籍装置、ゲーム装置またはそれらの任意の組み合わせを含む(これらの装置の付属品および周辺機器、またはこれらの任意の組み合わせを含む)。
サーバーは、物理サーバーであってもクラウドサーバーであってもよく、サーバーは単一のサーバーであってもサーバークラスタであってもよい。
以下、添付図面と併せて、本出願の実施例が提出するビデオ生成方法を詳細に説明する。
図2は、本開示の実施例中のビデオ生成方法のフローチャートであり、本実施例はテキスト情報に基づいてビデオを生成する場合に適用可能であり、本方法はビデオ生成装置によって実行され得、前記ビデオ生成装置はソフトウェアおよび/またはハードウェアの方式で実現され得、前記ビデオ生成方法は図1に記載の電子機器に実装され得る。
図2に示すように、本開示の実施例が提供するビデオ生成方法は主にステップS101~S104を含む。
S101、受信したテキストデータに基づいて初期マルチメディアデータを生成する。
本開示の一実施例では、テキストデータは、ユーザが入力装置によって電子機器に入力したデータであってもよく、他の装置から電子機器に送信されたデータであってもよい。
本開示の一実施例では、受信したテキストデータに基づいて初期マルチメディアデータを生成する前に、ユーザのデータ入力操作に応答して、テキストデータを受信することをさらに含む。ここで、ユーザのデータ入力操作は、テキストデータの追加操作を含んでもよく、テキストデータの入力操作を含んでもよく、本実施例では特に限定されない。
本開示の一実施例では、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含む。
本開示の一実施形態では、受信したテキストデータに基づいて初期マルチメディアデータを生成することは以下を含む。受信したテキストデータを少なくとも1つのテキストフラグメントに分割し、テキストフラグメントは複数のターゲットテキストフラグメントを含む。各ターゲットテキストフラグメントについて、ターゲットテキストフラグメントに基づいてプリセット画像ライブラリからターゲットテキストフラグメントに対応するビデオ画像を検索し、ビデオ画像をプリセット動画効果に従って処理し、ターゲットテキストフラグメントに対応するターゲットビデオフラグメントを得る。ターゲットテキストフラグメントに一致する読み上げ音声を取得し、ターゲット音声フラグメントを生成する。ターゲットビデオフラグメントとターゲット音声フラグメントを合成して、ターゲットマルチメディアフラグメントを得る。各ターゲットテキストフラグメントに対して、複数のターゲットマルチメディアフラグメントを取得し、複数のターゲットマルチメディアフラグメントをターゲットテキストフラグメントの前後順序で合成して、初期マルチメディアデータを取得する。
本開示の一実施形態では、ビデオ画像は、ターゲットテキストフラグメントに一致する字幕テキストを含む。
本開示の実施例では、ユーザがビデオを視聴する過程で読み上げ音声に対応する字幕を直感的に見ることを容易にし、ユーザの視聴体験を向上させるために、ビデオ画像にターゲットテキストフラグメントに一致する字幕テキストを追加する。
S102、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得する。
本開示の一実施形態では、クリッピングテンプレート取得要求に対する応答は、ユーザによる電子機器の操作を受け付けた後、クリッピングテンプレート取得要求に対する応答であってもよい。初期マルチメディアデータの生成を検出した後、クリッピングテンプレート取得要求に対する応答であってもよい。
ターゲットクリッピングテンプレートは、ユーザによる電子機器の操作に基づいて選択されたクリッピングテンプレートであってもよく、テキストデータ中のキーワードに基づいて自動的に照合されるクリッピングテンプレートであってもよい。
本開示の一実施形態では、ターゲットクリッピングテンプレートを取得することは、電子機器がローカルで予め記憶されたテンプレートデータベースからターゲットクリッピングモジュールを取得することを含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートを取得することは、電子機器がターゲットクリッピングテンプレートに対応するテンプレート識別子を取得し、テンプレート識別子を含むクリッピングテンプレート取得要求をサーバーに送信し、サーバーが該テンプレート識別子を含むクリッピングテンプレート取得要求に応答し、テンプレート識別子に基づいてターゲットクリッピングテンプレートを取得し、取得したターゲットクリッピングテンプレートを電子機器に返信することを含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートが取得されなかった場合、電子機器の表示インターフェースに1つのプロンプトポップアップボックスを表示し、前記プロンプトポップアップボックスは、ターゲットクリッピングテンプレートの取得に失敗したことを提示するために使用される。
本開示の一実施形態では、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定すること、ターゲットクリッピングテンプレートを取得すること、を含む。
本開示の一実施形態では、電子機器の対話インターフェースに少なくとも1つのテンプレートテーマコントロールが表示され、ユーザによるテンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定する。
図3に示すように、ユーザによるテンプレートテーマ1コントロールのトリガー操作に応答して、テンプレートテーマ1コントロールに対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定する。
本開示の実施例では、ユーザのトリガー操作により、ターゲットクリッピングテンプレートを選択することで、ユーザが満足するクリッピングテンプレートを選択しやすくなり、ユーザの使用体験が向上する。
本開示の一実施形態では、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示すること、ここで、ビデオ編集領域にテンプレートコントロールが含まれ、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、マスク領域に少なくとも1つのテンプレートテーマコントロールを表示すること、をさらに含む。
本開示の実施例では、図4に示すように、初期マルチメディアデータを生成した後、電子機器の表示インターフェースに、ビデオプレビュー領域10およびビデオ編集領域20が表示され、ビデオ編集領域20に複数の編集コントロール、例えば、テンプレートコントロール、画面コントロール、テキストコントロール、読み上げ音色コントロールおよび音楽コントロールが含まれる。ここで、テンプレートコントロールは、既存のテンプレートを使用して初期マルチメディアデータを編集することをユーザに指示するために使用される。画面コントロールは、初期マルチメディアデータ中のビデオ画像を編集することをユーザに指示するために使用される。テキストコントロールは、初期マルチメディアデータ中の字幕テキストを編集することをユーザに指示するために使用される。読み上げ音色コントロールは、初期マルチメディアデータ中の読み上げ音声を編集することをユーザに指示するために使用される。音楽コントロールは、初期マルチメディアデータ中のBGMを編集することをユーザに指示するために使用される。
本開示の一実施形態では、図4に示すように、ユーザによるテンプレートコントロールのトリガー操作に応答して、1つのマスク領域が表示され、マスク領域に複数のクリッピングテンプレートテーマコントロールが表示される。マスク領域に対する左右スワイプ操作に応答して、左右スワイプの効果を伴って複数のクリッピングテンプレートテーマコントロールを表示する。
本開示の実施例では、ユーザによるテンプレートコントロールのトリガー操作に応答した後、複数のテンプレートテーマコントロールが表示されるので、操作が簡単で理解しやすく、ユーザの操作の利便性が高い。
S103、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る。
本開示の一実施形態では、ターゲットクリッピングテンプレートは、少なくとも1つのクリッピング操作を含み、前記クリッピング操作は初期マルチメディアデータに適用されることで、初期マルチメディアデータに対してクリッピング操作を行うことができる。
本開示の一実施形態では、図5に示すように、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用する過程で、初期マルチメディアデータのクリッピングには一定時間がかかるため、電子機器の表示インターフェースに適用プロンプトボックスが表示され、前記適用プロンプトボックスは、クリッピングテンプレートにより示されたクリッピング操作で初期マルチメディアビデオに対してクリッピング処理を行っていることをユーザに指示するために使用される。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作が初期マルチメディアデータに正常に適用された場合、クリッピングテンプレートの適用成功のプロンプトメッセージが表示され、ターゲットクリッピングテンプレートにより示されたクリッピング操作が初期マルチメディアデータに失敗して適用された場合、クリッピングテンプレートの適用失敗のプロンプトメッセージが表示され、クリッピングテンプレートの再選択をユーザに促す。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む。
本開示の実施形態では、ターゲットクリッピングテンプレートは、1つまたは複数のビデオフラグメントを含む。ターゲットクリッピングテンプレートにより示されたクリッピング操作は、ビデオ合成操作の場合、ターゲットクリッピングテンプレートに含まれる1つまたは複数のビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成し、ターゲットマルチメディアデータを得ることを含む。
本開示の実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントをマルチメディアフラグメントの任意2つのビデオフレーム間に追加する。上記ビデオフラグメント合成操作は、既存のビデオ合成方法のいずれかであってもよく、本実施例において特に限定されない。
本開示の実施例では、クリッピングテンプレート中のビデオ合成操作により、複数のビデオの合成を実現し、ユーザがビデオを手動で合成することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。
本開示の一実施形態では、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成し、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データの前、および/または、初期マルチメディアデータの最後のフレーム媒体データの後、を含む。
本開示の実施例では、ターゲットクリッピングテンプレートは、複数のビデオフラグメントおよび各ビデオフラグメントに対応する追加位置を含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントに対応する追加位置がプロローグ位置である場合、該ビデオフラグメントをターゲットビデオプロローグとして初期マルチメディアデータの最初のフレーム媒体データの前に追加する。
本開示の一実施形態では、ターゲットクリッピングテンプレートに含まれるビデオフラグメントに対応する追加位置がエピローグ位置である場合、該ビデオフラグメントをターゲットビデオのプロローグとして初期マルチメディアデータの最後のフレーム媒体データの後に追加する。
本開示の一実施形態では、テキストデータにテキストテーマが含まれた場合、テキストテーマをプロローグに対応するビデオフラグメント中のテキストテーマの位置に追加し、ターゲットクリッピングテンプレートに含まれるテキストテーマ表示効果に従ってテキストテーマを編集して画面上にレンダリングする。さらに、テキストデータにテキスト著作者が含まれた場合、テキスト著作者をプロローグに対応するビデオフラグメント中のテキスト著作者の位置に追加し、ターゲットクリッピングテンプレートに含まれるテキスト著作者表示効果に従ってテキスト著作者情報を編集して画面上にレンダリングする。
本開示の一実施形態では、ビデオ作成者の情報を取得した場合、ビデオ作成者の情報をエピローグに対応するビデオフラグメント中の作成者の位置に追加し、ターゲットクリッピングテンプレートに含まれるビデオ作成者表示効果に従ってビデオ作成者の情報を編集して画面上にレンダリングする。
本開示の実施例では、クリッピングテンプレート中のビデオ合成操作により、プロローグおよび/またはエピローグの追加操作を実現することで、ユーザがプロローグまたはエピローグを手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加し、ターゲットマルチメディアデータを得ることを含む。
本開示の一実施形態では、初期マルチメディアデータはテキストデータに一致する複数のビデオ画像を含み、複数ビデオ画像を切り替える過程で、必然的に画像遷移設定を伴う。関連技術では、ユーザは、2つの隣接するビデオ画像間の遷移効果を手動で設定する必要があり、ビデオの作成時間コストが増加する。
本開示の一実施形態では、遷移効果は、カットインアニメーション効果、点滅アニメーション効果、グラデーションアニメーション効果、クロスディゾルブアニメーション効果、ズームアニメーション効果などのうちの1つまたは複数を含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、遷移設定操作は複数の遷移効果タイプを含む。遷移設定操作に含まれる複数遷移効果タイプのマルチメディアフラグメントへの適用に基づいて、各マルチメディアフラグメントはそれぞれ対応する遷移効果を有する。
本開示の一実施形態では、遷移設定操作に遷移効果タイプが含まれる場合、該遷移効果タイプをマルチメディアフラグメントに適用することにより、マルチメディアフラグメントが同じ遷移効果を有する。
本開示の実施例では、クリッピングテンプレート中の遷移設定操作により、マルチメディアフラグメントに遷移効果を付加し、ユーザが遷移効果を手動で設定することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、仮想対象追加操作によりターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得ることを含む。
本開示の一実施形態では、仮想対象は、ターゲットビデオフラグメント、仮想ステッカー、仮想オブジェクト、仮想カードなどの様々な対象を含む。選択可能に、顔装飾特徴、髪飾り特徴、衣服特徴および衣服アクセサリ特徴などを含んでもよい。
本開示の一実施形態では、ターゲットクリッピングテンプレートに保存された仮想対象を初期マルチメディアデータのプリセット位置に直接追加してもよい。選択可能に、プリセット位置の具体的なパラメータはターゲットクリッピングテンプレートに保存されてもよい。ターゲットクリッピングテンプレートに保存されたフラッシュ効果のステッカーを第3幅ビデオ画像に追加してもよい。
本開示の一実施形態では、テキスト情報に提示されたキーワードに基づいて、仮想対象の追加位置を決定してもよい。選択可能に、仮想対象をキーワードに対応するビデオ画像に追加してもよい。
本開示の実施例では、クリッピングテンプレート中の仮想対象追加操作により、マルチメディアフラグメントに仮想対象を追加することで、ユーザが仮想対象を手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートは背景音声を含む。背景音声追加操作により、背景音声に対応するタイムスタンプおよび読み上げ音声に対応するタイムスタンプに基づいて、背景音声と読み上げ音声を混合して、ターゲットマルチメディアデータを得る。
本開示の一実施形態では、読み上げ音声の再生パラメータに基づいて背景音声の再生パラメータを調整して、両者をよりよく融合させる。
本開示の実施例では、クリッピングテンプレート中の背景音声の追加操作により、マルチメディアフラグメントにBGMを追加し、ユーザがBGMを手動で追加することを回避し、ビデオの作成時間コストを削減し、作成されたビデオ品質を向上させる。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用することは、少なくとも1つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出すること、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。
本開示の一実施形態では、キーワードは、日付、数字、人物名称、専用名称、地名、植物、動物などを含む。
本開示の一実施形態では、ターゲットテキストフラグメントは「張三が同日に李四に現金20万元を支払った」であり、前記ターゲットテキストフラグメントから抽出されたキーワードは「20万元」である場合、キーワード「20万元」を該ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加する。
本開示の一実施形態では、ターゲットクリッピングモジュールはキーワードパラメータをさらに含み、ここで、キーワードパラメータは、キーワードの色、フォント、追加効果などを含む。キーワードパラメータに従って、ターゲットマルチメディアフラグメントにおけるキーワードの表示情報を設定する。
本開示の実施例では、クリッピングテンプレート中のキーワード抽出操作により、マルチメディアフラグメントにキーワードを追加することで、ユーザが該テキストフラグメントのキー情報をより明確に理解できる。
本開示の一実施形態では、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、キーワードに一致するキーテキスト情報を取得すること、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。
本開示の実施例では、ターゲットテキストフラグメントからキーワードを抽出した後、上記キーワードに基づいてキーワードに一致するキー情報を取得する。例えば、キーワードは「王五」であり、キーワードに一致するキー情報は、「王五が俳優であり、代表作が《テレビシリーズA》、《映画B》である」である。このとき、「王五」をキーワードとし、「俳優」、「代表作《テレビシリーズA》、《映画B》」をキーテキスト情報として、ターゲットマルチメディアフラグメントに追加する。また、キーワードが「職務上横領罪」であり、それに一致するキーテキスト情報が「職務上横領罪とは、会社、企業その他の単位に属する者が、その地位の利便性を利用して、比較的多額の金銭をもって、その単位の財産を不正に自分のものとする行為をいう」である場合、「職務上横領罪」をキーワードとし、「職務上横領罪とは、会社、企業その他の単位に属する者が、その地位の利便性を利用して、比較的多額の金銭をもって、その単位の財産を不正に自分のものとする行為をいう」をキーテキスト情報として、ターゲットマルチメディアフラグメントに追加する。
本開示の一実施形態では、キーワード、キーテキスト情報に異なる表示パラメータを設定してもよい。
本開示の一実施形態では、上記キーワードに一致するキーテキスト情報は、テキストデータから抽出されたテキスト情報であってもよく、インターネットまたはプリセット知識ベースから取得したテキスト情報であってもよい。キーテキスト情報の取得方法は本実施例では特に限定されない。
本開示の実施例では、キーワードによりキーテキスト情報を抽出し、キーワードとキーテキスト情報をビデオに追加することで、ユーザはキーワードに関連する知識を素早く理解し、テキストデータの内容を理解することを支援する。
S104、ターゲットマルチメディアデータに基づいてターゲットビデオを生成する。
本開示の実施例はビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品を提供し、この方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。本開示の実施例では、取得したクリッピングテンプレート中のクリッピング操作をマルチメディアデータに直接適用してビデオを生成することで、ユーザが手動でビデオをクリッピングすることなく、ビデオの作成時間コストを削減できるだけでなく、作成されたビデオの品質を向上させることができる。
図6は、本開示の実施例中のビデオ生成方法のフローチャートであり、本実施例はテキスト情報に基づいてビデオを生成する場合に適用可能であり、本方法は、ビデオ生成装置によって実行され得、前記ビデオ生成装置はソフトウェアおよび/またはハードウェアの方式で実現され得、前記ビデオ生成装置は電子機器に設けられ得る。
図6に示すように、本開示の実施例が提供するビデオ生成装置60は主に、初期マルチメディアデータ生成モジュール61、ターゲットクリッピングテンプレート取得モジュール62、ターゲットマルチメディアデータ生成モジュール63およびターゲットビデオ生成モジュール64を備える。
ここで、初期マルチメディアデータ生成モジュール61は、受信したテキストデータに基づいて初期マルチメディアデータを生成するために使用され、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、ターゲットクリッピングテンプレート取得モジュール62は、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するために使用され、ターゲットマルチメディアデータ生成モジュール63は、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るために使用され、ターゲットビデオ生成モジュール64は、ターゲットマルチメディアデータに基づいてターゲットビデオを生成するために使用される。
本開示の一実施形態では、ビデオ画像は、ターゲットテキストフラグメントに一致する字幕テキストを含む。
本開示の一実施形態では、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するために使用されるターゲットクリッピングテンプレート取得モジュール62は、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定するために使用されるターゲットクリッピングテンプレート決定ユニットと、ターゲットクリッピングテンプレートを取得するために使用されるターゲットクリッピングテンプレート取得ユニットと、を備える。
本開示の一実施形態では、ターゲットクリッピングテンプレート取得モジュール62は、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示するために使用されるビデオ編集領域表示ユニットと、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示し、マスク領域に少なくとも1つのテンプレートテーマコントロールを表示するために使用されるマスク領域表示ユニットと、をさらに備える。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットマルチメディアデータ生成モジュール63は、具体的に、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得るために使用される。
本開示の一実施形態では、ターゲットマルチメディアデータ生成モジュール63は、具体的に、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得るために使用され、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および/または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットマルチメディアデータ生成モジュール63は、具体的に、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加して、ターゲットマルチメディアデータを得るために使用される。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットマルチメディアデータ生成モジュール63は、具体的に、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得るために使用される。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットマルチメディアデータ生成モジュール63は、具体的に、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得るために使用される。
本開示の一実施形態では、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットマルチメディアデータ生成モジュール63は、具体的に、少なくとも1つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出し、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。
本開示の一実施形態では、ターゲットマルチメディアデータ生成モジュール63は、具体的に、キーワードに一致するキーテキスト情報を取得し、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。
本開示の実施例が提供するビデオ生成装置は、本開示の方法実施例が提供するビデオ生成方法中のステップを実行可能であり、その実行ステップおよび有益な効果はここで繰り返さない。
図7は、本開示の実施例中の電子機器の概略構造図である。以下の図7を具体的に参照すると、本開示の実施例の実施に適した電子機器700の概略構造図である。本開示の実施例中の電子機器700は、携帯電話、ノートパソコン、デジタル放送受信機、PDA(パーソナルデジタルアシスタント)、PAD(タブレットコンピュータ)、PMP(ポータブルマルチメディアプレーヤ)、車載端末(例えば車載ナビゲーション端末)、ウェアラブル端末装置などのモバイル端末、およびデジタルTV、デスクトップパソコン、スマートホーム装置などの固定端末を含むが、これらに限定されない。図7に示す電子機器は単なる例示であり、本開示の実施例の機能および使用範囲を何ら限定するものではない。
図7に示すように、電子機器700は、読み取り専用メモリ(ROM)702に記憶されたプログラムまたは記憶装置708からランダムアクセスメモリ(RAM)703にロードされたプログラムに従って様々な適切な動作および処理を実行して本開示の実施例の画像レンダリング方法を実現するための処理装置(例えば中央処理装置、グラフィックプロセッサなど)701を備える。RAM703には、端末装置700の操作に必要な様々なプログラムおよびデータがさらに記憶される。処理装置701、ROM702およびRAM703はバス704を介して互いに接続される。入力/出力(I/O)インターフェース705もバス704に接続される。
通常、I/Oインターフェース705には、タッチスクリーン、タッチパッド、キーボード、マウス、カメラ、マイク、加速度計、ジャイロスコープなどの入力装置706、液晶ディスプレイ(LCD)、スピーカ、バイブレータなどの出力装置707、磁気テープ、ハードディスクなどの記憶装置708、および通信装置709が接続される。通信装置709により、端末装置700が無線または有線通信を介して他の装置とデータを交換することができる。図7では様々なデバイスを備えた端末装置700が図示されているが、図示されたデバイスのすべてを実装または具備する必要がないことを理解されたい。代替的に、より多くのまたはより少ないデバイスを実装または具備してもよい。
特に、本開示の実施例によれば、フローチャートを参照して上記したプロセスは、コンピュータソフトウェアプログラムとして実装されてもよい。例えば、本開示の実施例は、非一過性のコンピュータ可読媒体上に担持されるコンピュータプログラムを含むコンピュータプログラム製品を提供し、前記コンピュータプログラムは前記のビデオ生成方法を実行するためのプログラムコードを含む。このような実施例では、前記コンピュータプログラムは、通信装置709を介してネットワークからダウンロードされ、インストールされてもよく、または記憶装置708からインストールされてもよく、またはROM702からインストールされてもよい。このコンピュータプログラムが処理装置701によって実行されると、本開示の実施例の方法において定義された上記機能が実現される。
なお、本開示に記載のコンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体または上記両者の任意の組み合わせであってもよい。コンピュータ可読記憶媒体は例えば電気、磁気、光、電磁気、赤外線、または半導体のシステム、装置またはデバイス、または任意の組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、1つまたは複数の導線を有する電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、または上記の任意適切な組み合わせであってもよいが、これらに限定されない。本開示では、コンピュータ可読記憶媒体は、プログラムを含むまたは記憶する任意の有形媒体であってもよく、このプログラムが命令実行システム、装置またはデバイスによって使用される、または組み合わせて使用されてもよい。本開示では、コンピュータ可読信号媒体は、ベースバンドで、またはキャリアの一部として伝搬されるデータ信号を含んでもよく、コンピュータ可読プログラムコードが担持される。このような伝搬データ信号は、電磁信号、光信号または上記の任意の適切な組み合わせを含むが、これらに限定されない。コンピュータ可読信号媒体は、命令実行システム、装置またはデバイスによって使用される、または組み合わせて使用されるプログラムを送信、伝搬または転送するコンピュータ可読記憶媒体以外の任意のコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体に含まれるプログラムコードは、ワイヤ、光ファイバケーブル、RF(無線周波数)など、または上記の任意の適切な組み合わせなどの任意の適切な媒体によって転送されてもよいが、これらに限定されない。
いくつかの実施形態では、クライアント、サーバーは、HTTP(HyperText Transfer Protocol、ハイパーテキスト・トランスファー・プロトコル)などの任意の現在既知または将来開発されるネットワークプロトコルを使用して通信してもよく、任意形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)と相互接続してもよい。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、インターネットワーク(例えば、インターネット)およびエンドツーエンドネットワーク(例えば、ad hocエンドツーエンドネットワーク)、および任意の現在既知または将来開発されるネットワークが挙げられる。
上記コンピュータ可読記憶媒体は、上記電子機器に含まれてもよく、または前記電子機器に組み込まれずに別体であってもよい。
上記コンピュータ可読記憶媒体は、1つまたは複数のプログラムを格納しており、上記1つまたは複数のプログラムが前記端末装置によって実行されると、前記端末装置に、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を実行させる。
選択可能に、上記1つまたは複数のプログラムが前記端末装置によって実行されると、前記端末装置に上記実施例に記載の他のステップを実行させることができる。
1つまたは複数のプログラミング言語またはその組み合わせで、本開示の動作を実行するためのコンピュータプログラムコードを記述することができ、上記プログラミング言語は、オブジェクト指向プログラミング言語(Java、Smalltalk、C++など)、および従来の手続き型プログラミング言語(「C」言語または類似のプログラミング言語)を含むが、これらに限定されない。プログラムコードは、完全にユーザのコンピュータ上で実行してもよく、部分的にユーザのコンピュータ上で実行してもよく、スタンドアロンソフトウェアパッケージとして実行してもよく、部分的にユーザのコンピュータ上で実行し、部分的にリモートコンピュータ上で実行してもよく、または完全にリモートコンピュータまたはサーバー上で実行してもよい。リモートコンピュータの場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)などのあらゆる種類のネットワークを介してユーザのコンピュータに接続されてもよいし、または、外部コンピュータに接続されてもよい(例えばインターネットサービスプロバイダを使用してインターネットを介して接続される)。
添付図面のフローチャートおよびブロック図は、本開示の様々な実施例に従ったシステム、方法およびコンピュータプログラム製品の可能なアーキテクチャ、機能および動作を示す。この点で、フローチャートまたはブロック図の各ボックスは、1つのモジュール、プログラムセグメント、またはコードの一部を表す場合があり、このモジュール、プログラムセグメント、またはコードの一部は指定された論理機能を実装するための1つまたは複数の実行可能命令を含む。また、代替としてのいくつかの実装では、ボックス内に示された機能は、添付図面に示された順序と異なる順序で発生する可能性もあることに留意されたい。例えば、連続して表現された2つのボックスは実際には実質的に並行して実行されることがあり、関連する機能によって、逆の順序で実行されることもある。また、ブロック図および/またはフローチャート中の各ボックス、およびブロック図および/またはフローチャート中のボックスの組み合わせは、指定された機能または操作を実行する専用のハードウェアベースのシステムで実装されてもよいし、または専用ハードウェアとコンピュータ命令の組み合わせで実装されてもよいことに留意されたい。
本開示の実施例において説明されるユニットはソフトウェアによって実装されてもよく、ハードウェアによって実装されてもよい。ここで、ユニットの名称は、所与の状況におけるユニット自身の限定を構成するものではない。
本明細書において上記した機能は少なくとも部分的に、1つまたは複数のハードウェア論理構成要素によって実行されてもよい。例えば、非限定的に、使用され得る例示的なハードウェア論理構成要素は、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、複合プログラマブル論理デバイス(CPLD)などを含む。
本開示の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置またはデバイスによって使用される、または命令実行システム、装置またはデバイスと組み合わせて使用されるプログラムを含むまたは記憶する有形の媒体であってもよい。コンピュータ可読記憶媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読記憶媒体は、電子、磁気、光学、電磁、赤外線、または半導体システム、装置またはデバイス、またはこれらの任意の適切な組み合わせを含むが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、1つまたは複数のワイヤに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、この方法は、受信したテキストデータに基づいて初期マルチメディアデータを生成すること、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得る、ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ビデオ画像は、ターゲットテキストフラグメントに一致する字幕テキストを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定すること、ターゲットクリッピングテンプレートを取得すること、を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示すること、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、マスク領域に少なくとも1つのテンプレートテーマコントロールを表示すること、をさらに含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることは、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および/または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加し、ターゲットマルチメディアデータを得ることを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得ることを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用することは、少なくとも1つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出すること、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成方法を提供し、ここで、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、キーワードに一致するキーテキスト情報を取得すること、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、この装置は、受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、初期マルチメディアデータは、テキストデータの読み上げ音声がテキストデータに一致するビデオ画像を含み、初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、少なくとも1つのマルチメディアフラグメントはそれぞれテキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、ターゲットビデオフラグメントは、ターゲットテキストフラグメントに一致するビデオ画像を含み、ターゲット音声フラグメントは、ターゲットテキストフラグメントに一致する読み上げ音声を含み、クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
ターゲットクリッピングテンプレートにより示されたクリッピング操作を初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るために使用されるターゲットマルチメディアデータ生成モジュールと、ターゲットマルチメディアデータに基づいてターゲットビデオを生成するために使用されるターゲットビデオ生成モジュールと、を備える。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ビデオ画像はターゲットテキストフラグメントに一致する字幕テキストを含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレート取得モジュールは、クリッピングテンプレート取得要求に応答して、取得ターゲットクリッピングテンプレートするために使用され、ターゲットクリッピングテンプレート決定ユニットは、テンプレートテーマコントロールのトリガー操作に応答して、トリガー操作に対応するクリッピングテンプレートをターゲットクリッピングテンプレートとして決定するために使用され、ターゲットクリッピングテンプレート取得ユニットは、ターゲットクリッピングテンプレートを取得するために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレート取得モジュールは、クリッピングテンプレートコントロールのトリガー操作に応答する前に、ビデオ編集領域を表示するためのビデオ編集領域表示ユニットと、ここで、ビデオ編集領域はテンプレートコントロールを含み、テンプレートコントロールのトリガー操作に応答して、マスク領域を表示し、マスク領域に少なくとも1つのテンプレートテーマコントロールを表示するためのマスク領域表示ユニットと、をさらに備える。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、ビデオ合成操作に基づいてターゲットクリッピングテンプレートに含まれるビデオフラグメントと初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得るために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットマルチメディアデータ生成モジュールは、具体的に、ビデオ合成操作に基づいて、ターゲットクリッピングテンプレートに含まれるビデオフラグメントを初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得るために使用され、ここで、設定位置は、初期マルチメディアデータの最初のフレーム媒体データ之前、および/または、初期マルチメディアデータの最後のフレーム媒体データの後を含む。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、遷移設定操作に基づいて初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を付加して、ターゲットマルチメディアデータを得るために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、仮想対象追加操作に基づいてターゲットクリッピングテンプレートに含まれる仮想対象を初期マルチメディアデータのプリセット位置に追加して、ターゲットマルチメディアデータを得るために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、背景音声追加操作に基づいてターゲットクリッピングテンプレートに含まれる背景音声と初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得るために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、ターゲットマルチメディアデータ生成モジュールは、具体的に、少なくとも1つのターゲットテキストフラグメントに対して、ターゲットテキストフラグメント中のキーワードを抽出し、キーワードをターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。
本開示の1つまたは複数の実施例によれば、本開示はビデオ生成装置を提供し、ここで、ターゲットマルチメディアデータ生成モジュールは、具体的に、キーワードに一致するキーテキスト情報を取得し、キーワードとキーテキスト情報をターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加するために使用される。
本開示の1つまたは複数の実施例によれば、本開示は電子機器を提供し、
1つまたは複数のプロセッサと、
1つまたは複数のプログラムを記憶するためのメモリと、を備え、
1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに、本開示が提供するいずれか1つのビデオ生成方法を実行させる。
本開示の1つまたは複数の実施例によれば、本開示はコンピュータ可読記憶媒体を提供し、コンピュータプログラムが記憶され、前記プログラムがプロセッサによって実行されると本開示が提供するいずれか1つのビデオ生成方法を実行させる。
本開示の実施例は、コンピュータプログラム製品をさらに提供し、前記コンピュータプログラム製品はコンピュータプログラムまたは命令を含み、前記コンピュータプログラムまたは命令がプロセッサによって実行されると上記のビデオ生成方法を実行させる。
以上の説明は、本開示の好ましい実施例、および採用される技術的原理の説明例示である。当業者にとって、本開示に関わる開示範囲は、上記技術的特徴の特定の組み合わせによって形成される技術的解決策に限定されるものではなく、上記開示範囲から逸脱することなく、上記技術的特徴またはその等価特徴の任意の組み合わせによって形成される他の技術的解決策もカバーすべきであることを理解されたい。例えば、上記した特徴を、本開示に開示される同様機能を有する技術的特徴と置換するによって形成される技術的解決策(これらに限定されない)もカバーする。
さらに、各動作は特定の順序を用いて描かれているが、これは、動作が示された特定の順序または順次実行されることを要求するものとして解釈されるべきではない。特定の環境において、マルチタスクおよび並行処理は有利であり得る。同様に、いくつかの具体的な実装の詳細が上記の議論に含まれているが、これらは、本開示の範囲を限定するものとして解釈されるべきではない。単一実施例の文脈で説明した特定の特徴は、単一の実施例において組み合わせて実装することもできる。逆に、単一の実施例の文脈で説明した様々な特徴も、個別に、または任意の適切なサブコンビネーションで、複数の実施例で実施することができる。
本主題は、構造的特徴および/または方法論理作用に特有の言語を用いて説明されてきたが、添付の特許請求の範囲に定義される主題は、必ずしも上述の特定の特徴または作用に限定されないことを理解されたい。むしろ、上述した特定の特徴および動作は、特許請求の範囲を実施する例示的な形態に過ぎない。

Claims (15)

  1. ビデオ生成方法であって、
    受信したテキストデータに基づいて初期マルチメディアデータを生成することであって、前記初期マルチメディアデータは前記テキストデータの読み上げ音声が前記テキストデータに一致するビデオ画像を含み、前記初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、前記少なくとも1つのマルチメディアフラグメントはそれぞれ前記テキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、前記少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、前記少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、前記ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、前記ターゲットビデオフラグメントは前記ターゲットテキストフラグメントに一致するビデオ画像を含み、前記ターゲット音声フラグメントは、前記ターゲットテキストフラグメントに一致する読み上げ音声を含む、生産すること、
    クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得すること、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ること、および、
    前記ターゲットマルチメディアデータに基づいてターゲットビデオを生成すること、を含
    前記クリッピング操作は、ビデオ合成操作、遷移設定操作、仮想対象追加操作、背景音声追加操作、およびキーワード抽出操作のうちの少なくとも1つを含む、
    ことを特徴とする方法。
  2. 前記ビデオ画像は、前記ターゲットテキストフラグメントに一致する字幕テキストを含む、ことを特徴とする請求項1に記載の方法。
  3. クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得することは、
    テンプレートテーマコントロールのトリガー操作に応答して、前記トリガー操作に対応するクリッピングテンプレートを前記ターゲットクリッピングテンプレートとして決定すること、
    前記ターゲットクリッピングテンプレートを取得すること、を含む、ことを特徴とする請求項1に記載の方法。
  4. クリッピングテンプレートコントロールのトリガー操作に応答する前に、
    ビデオ編集領域を表示すること、ここで、前記ビデオ編集領域はテンプレートコントロールを含み、
    前記テンプレートコントロールのトリガー操作に応答して、マスク領域を表示すること、
    前記マスク領域に少なくとも1つのテンプレートテーマコントロールを表示すること、をさらに含む、ことを特徴とする請求項3に記載の方法。
  5. 前記ターゲットクリッピングテンプレートにより示されたクリッピング操作はビデオ合成操作を含み、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
    前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントと前記初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項1に記載の方法。
  6. 前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントと前記初期マルチメディアデータに含まれるマルチメディアフラグメントを合成して、ターゲットマルチメディアデータを得ることは、
    前記ビデオ合成操作に基づいて、前記ターゲットクリッピングテンプレートに含まれるビデオフラグメントを前記初期マルチメディアデータに含まれるマルチメディアフラグメントの設定位置にロードして、ターゲットマルチメディアデータを得ることを含み、ここで、前記設定位置は、前記初期マルチメディアデータの最初のフレーム媒体データの前、および/または、前記初期マルチメディアデータの最後のフレーム媒体データの後、を含む、ことを特徴とする請求項5に記載の方法。
  7. 前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は遷移設定操作を含み、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
    前記遷移設定操作に基づいて前記初期マルチメディアデータに含まれるマルチメディアフラグメントに遷移効果を追加し、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項1に記載の方法。
  8. 前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は仮想対象追加操作を含み、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
    前記仮想対象追加操作に基づいて、前記ターゲットクリッピングテンプレートに含まれる仮想対象を前記初期マルチメディアデータのプリセット位置に直接追加して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項1に記載の方法。
  9. 前記ターゲットクリッピングテンプレートにより示されたクリッピング操作は背景音声追加操作を含み、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得ることは、
    前記背景音声追加操作に基づいて、前記ターゲットクリッピングテンプレートに含まれる背景音声と前記初期マルチメディアデータに含まれる読み上げ音声を混合して、ターゲットマルチメディアデータを得ることを含む、ことを特徴とする請求項1に記載の方法。
  10. 前記ターゲットクリッピングテンプレートにより示されたクリッピング操作はキーワード抽出操作を含み、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用することは、
    少なくとも1つのターゲットテキストフラグメントに対して、前記ターゲットテキストフラグメント中のキーワードを抽出すること、
    前記キーワードを前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む、ことを特徴とする請求項1に記載の方法。
  11. 前記キーワードを前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加することは、
    前記キーワードに一致するキーテキスト情報を取得すること、
    前記キーワードと前記キーテキスト情報を前記ターゲットテキストフラグメントに対応するターゲットマルチメディアフラグメントに追加すること、を含む、ことを特徴とする請求項10に記載の方法。
  12. 受信したテキストデータに基づいて初期マルチメディアデータを生成するための初期マルチメディアデータ生成モジュールと、ここで、前記初期マルチメディアデータは、前記テキストデータの読み上げ音声が前記テキストデータに一致するビデオ画像を含み、前記初期マルチメディアデータは少なくとも1つのマルチメディアフラグメントを含み、前記少なくとも1つのマルチメディアフラグメントはそれぞれ前記テキストデータによって分割された少なくとも1つのテキストフラグメントに対応し、前記少なくとも1つのマルチメディアフラグメント中のターゲットマルチメディアフラグメントは、前記少なくとも1つのテキストフラグメント中のターゲットテキストフラグメントに対応し、前記ターゲットマルチメディアフラグメントはターゲットビデオフラグメントおよびターゲット音声フラグメントを含み、前記ターゲットビデオフラグメントは前記ターゲットテキストフラグメントに一致するビデオ画像を含み、前記ターゲット音声フラグメントは、前記ターゲットテキストフラグメントに一致する読み上げ音声を含み、
    クリッピングテンプレート取得要求に応答して、ターゲットクリッピングテンプレートを取得するためのターゲットクリッピングテンプレート取得モジュールと、
    前記ターゲットクリッピングテンプレートにより示されたクリッピング操作を前記初期マルチメディアデータに適用して、ターゲットマルチメディアデータを得るためのターゲットマルチメディアデータ生成モジュールと、
    前記ターゲットマルチメディアデータに基づいてターゲットビデオを生成するためのターゲットビデオ生成モジュールと、を備え
    前記クリッピング操作は、ビデオ合成操作、遷移設定操作、仮想対象追加操作、背景音声追加操作、およびキーワード抽出操作のうちの少なくとも1つを含む、ことを特徴とするビデオ生成装置。
  13. 1つまたは複数のプロセッサと、
    1つまたは複数のプログラムを記憶するための記憶装置と、を備え、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1~11のいずれか1項に記載の方法を実行させる、ことを特徴とする電子機器。
  14. コンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、請求項1~11のいずれか1項に記載の方法を実行させる、ことを特徴とするコンピュータ可読記憶媒体。
  15. コンピュータプログラムまたは命令を含むコンピュータプログラムであって、前記コンピュータプログラムまたは命令がプロセッサによって実行されると請求項1~11のいずれか1項に記載の方法を実行させる、コンピュータプログラム。
JP2023578709A 2022-05-10 2023-05-09 ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品 Active JP7732004B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202210508063.2A CN117082292A (zh) 2022-05-10 2022-05-10 视频生成方法、装置、设备、存储介质和程序产品
CN202210508063.2 2022-05-10
PCT/CN2023/093089 WO2023217155A1 (zh) 2022-05-10 2023-05-09 视频生成方法、装置、设备、存储介质和程序产品

Publications (2)

Publication Number Publication Date
JP2024528440A JP2024528440A (ja) 2024-07-30
JP7732004B2 true JP7732004B2 (ja) 2025-09-01

Family

ID=88701054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023578709A Active JP7732004B2 (ja) 2022-05-10 2023-05-09 ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品

Country Status (5)

Country Link
US (1) US20240296871A1 (ja)
EP (1) EP4344230A4 (ja)
JP (1) JP7732004B2 (ja)
CN (1) CN117082292A (ja)
WO (1) WO2023217155A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118828105B (zh) * 2023-04-19 2025-09-30 北京字跳网络技术有限公司 视频生成方法、装置、设备、存储介质和程序产品
JP7782941B2 (ja) 2023-04-19 2025-12-09 北京字跳▲網▼絡技▲術▼有限公司 動画生成方法、装置、機器、記憶媒体及びプログラム製品
CN120067348A (zh) * 2023-11-30 2025-05-30 北京字跳网络技术有限公司 一种文本处理方法、系统、装置、设备及存储介质
CN119135988A (zh) * 2024-10-10 2024-12-13 北京字跳网络技术有限公司 一种视频列表的处理方法、装置、设备、介质及程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109756751A (zh) 2017-11-07 2019-05-14 腾讯科技(深圳)有限公司 多媒体数据处理方法及装置、电子设备、存储介质
JP2021033367A (ja) 2019-08-15 2021-03-01 ヤフー株式会社 生成装置、生成方法および生成プログラム
CN112449231A (zh) 2019-08-30 2021-03-05 腾讯科技(深圳)有限公司 多媒体文件素材的处理方法、装置、电子设备及存储介质
JP2021069117A (ja) 2019-10-22 2021-04-30 パロ アルト リサーチ センター インコーポレイテッド ローカライズされたコンテキストのビデオ注釈を生成するためのシステム及び方法
CN113452941A (zh) 2021-05-14 2021-09-28 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN113473182A (zh) 2021-09-06 2021-10-01 腾讯科技(深圳)有限公司 一种视频生成的方法及装置、计算机设备和存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180143741A1 (en) * 2016-11-23 2018-05-24 FlyrTV, Inc. Intelligent graphical feature generation for user content
JP6887132B2 (ja) * 2018-04-12 2021-06-16 パナソニックIpマネジメント株式会社 映像処理装置、映像処理システム及び映像処理方法
CN112738623B (zh) * 2019-10-14 2022-11-01 北京字节跳动网络技术有限公司 视频文件的生成方法、装置、终端及存储介质
CN111243632B (zh) * 2020-01-02 2022-06-24 北京达佳互联信息技术有限公司 多媒体资源的生成方法、装置、设备及存储介质
CN111246300B (zh) * 2020-01-02 2022-04-22 北京达佳互联信息技术有限公司 剪辑模板的生成方法、装置、设备及存储介质
CN111460183B (zh) * 2020-03-30 2024-02-13 北京金堤科技有限公司 多媒体文件生成方法和装置、存储介质、电子设备
CN111935491B (zh) * 2020-06-28 2023-04-07 百度在线网络技术(北京)有限公司 直播的特效处理方法、装置以及服务器
US11626139B2 (en) * 2020-10-28 2023-04-11 Meta Platforms Technologies, Llc Text-driven editor for audio and video editing
CN112579826A (zh) * 2020-12-07 2021-03-30 北京字节跳动网络技术有限公司 视频显示及处理方法、装置、系统、设备、介质
CN114339399B (zh) * 2021-12-27 2024-12-13 咪咕文化科技有限公司 多媒体文件剪辑方法、装置及计算设备
US12154598B1 (en) * 2022-03-29 2024-11-26 United Services Automobile Association (Usaa) System and method for generating synthetic video segments during video editing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109756751A (zh) 2017-11-07 2019-05-14 腾讯科技(深圳)有限公司 多媒体数据处理方法及装置、电子设备、存储介质
JP2021033367A (ja) 2019-08-15 2021-03-01 ヤフー株式会社 生成装置、生成方法および生成プログラム
CN112449231A (zh) 2019-08-30 2021-03-05 腾讯科技(深圳)有限公司 多媒体文件素材的处理方法、装置、电子设备及存储介质
JP2021069117A (ja) 2019-10-22 2021-04-30 パロ アルト リサーチ センター インコーポレイテッド ローカライズされたコンテキストのビデオ注釈を生成するためのシステム及び方法
CN113452941A (zh) 2021-05-14 2021-09-28 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN113473182A (zh) 2021-09-06 2021-10-01 腾讯科技(深圳)有限公司 一种视频生成的方法及装置、计算机设备和存储介质

Also Published As

Publication number Publication date
EP4344230A1 (en) 2024-03-27
EP4344230A4 (en) 2024-10-30
US20240296871A1 (en) 2024-09-05
CN117082292A (zh) 2023-11-17
WO2023217155A1 (zh) 2023-11-16
JP2024528440A (ja) 2024-07-30

Similar Documents

Publication Publication Date Title
JP7732004B2 (ja) ビデオ生成方法、装置、デバイス、記憶媒体およびプログラム製品
KR102792043B1 (ko) 비디오 생성 장치 및 방법, 전자 장치, 및 컴퓨터 판독가능 매체
WO2021196903A1 (zh) 视频处理方法、装置、可读介质及电子设备
US11710510B2 (en) Video generation method and apparatus, electronic device, and computer readable medium
JP7760760B2 (ja) メディアコンテンツ処理の方法、装置、電子デバイス、記憶媒体及びコンピュータプログラム
JP7715453B2 (ja) アイテム処理方法、装置、機器及び媒体
US20240339132A1 (en) Video generation method and apparatus, and electronic device and medium
CN112380379A (zh) 歌词特效展示方法、装置、电子设备及计算机可读介质
US20240007718A1 (en) Multimedia browsing method and apparatus, device and mediuim
JP7684446B2 (ja) ビデオ生成方法、装置、機器、記憶媒体及びプログラム製品
WO2023165515A1 (zh) 拍摄方法、装置、电子设备和存储介质
JP7787878B2 (ja) 検索コンテンツのマッチング方法、装置、電子機器および記憶媒体
CN117793478A (zh) 讲解信息生成方法、装置、设备、介质和程序产品
US20240040069A1 (en) Image special effect configuration method, image recognition method, apparatus and electronic device
CN118409683A (zh) 对象展示方法、装置、电子设备、存储介质和程序产品
CN112307393A (zh) 信息发布方法、装置和电子设备
CN117041674A (zh) 特效的生成方法、装置、电子设备和存储介质
CN119031201A (zh) 视频生成方法、装置、设备、存储介质和程序产品
CN119364091A (zh) 视频生成方法、装置、可读介质、电子设备及程序产品
WO2025189960A1 (zh) 特效编辑方法、装置、电子设备、存储介质及程序产品
CN113885741A (zh) 一种多媒体处理方法、装置、设备及介质
JP7782941B2 (ja) 動画生成方法、装置、機器、記憶媒体及びプログラム製品
CN114520928A (zh) 显示信息生成方法、信息显示方法、装置和电子设备
JP7676673B2 (ja) 撮像方法、装置、機器、記憶媒体及びプログラム製品
CN121309934A (zh) 一种视频生成方法、装置、设备、介质及程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250820

R150 Certificate of patent or registration of utility model

Ref document number: 7732004

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150