JP2019009754A - リアルタイム増強合成技術を用いた映像生成サーバ、映像生成システム及び方法 - Google Patents
リアルタイム増強合成技術を用いた映像生成サーバ、映像生成システム及び方法 Download PDFInfo
- Publication number
- JP2019009754A JP2019009754A JP2017144280A JP2017144280A JP2019009754A JP 2019009754 A JP2019009754 A JP 2019009754A JP 2017144280 A JP2017144280 A JP 2017144280A JP 2017144280 A JP2017144280 A JP 2017144280A JP 2019009754 A JP2019009754 A JP 2019009754A
- Authority
- JP
- Japan
- Prior art keywords
- special effect
- scene
- video
- size
- special
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000015572 biosynthetic process Effects 0.000 title claims description 7
- 238000003786 synthesis reaction Methods 0.000 title claims description 7
- 238000005516 engineering process Methods 0.000 title claims description 6
- 230000000694 effects Effects 0.000 claims abstract description 185
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 230000008921 facial expression Effects 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 206010011469 Crying Diseases 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Processing Or Creating Images (AREA)
- Studio Circuits (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】映像生成サーバ及び方法を提供する。【解決手段】映像生成サーバは、ソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び映像コンテンツ編集に付加される特殊効果を含む映像編集データを保存するデータベースと、ユーザによって登録された映像コンテンツを構成する場面に含まれるオブジェクトを認識して場面に付加される特殊効果を抽出する抽出モジュールと、場面を構成するオブジェクトのサイズと種類によって抽出された特殊効果の場面での設定位置を検出し、設定位置で前記特殊効果のサイズを算出する特殊効果調整モジュールと、特殊効果調整モジュールによって設定位置とサイズが調整された特殊効果を反映した場面をディスプルレイし、ディスプレイされた場面のうち一つを選んでもらい、これを保存し、選択された場面で映像を生成するディスプレイモジュールとを含む。【選択図】図1A
Description
本発明は、映像生成サーバ及び方法に係るものであって、具体的にはライブソーシャルメディアプラットフォームサービスでリアルタイム増強合成技術を用いた映像生成サーバび方法に関する。
に関するものである。
に関するものである。
本明細書において、別に表示されない限り、このセクションで説明する内容は本願発明の請求項に対する従来技術ではなく、このセクションに含まれるといって従来技術と認められるものではない。
近年、動画、イメージ、ビデオクリップなど、独自創作映像コンテンツ(UCC、User Created Contents)に対する関心が日増しに高まっている。実際、動画プラットフォームであるユーチューブ(Youtube)には毎日新しい独自創作映像がアップロードされている。最近は料理、旅行、化粧、カラーリング方法など創作される動画のテーマが非常に多様になっている傾向にあることから、動画撮影後の編集時に、単に背景フレームを挿入するだけでは完成された映像の品質を高めることはできない。
また、独自の創作映像コンテンツの供給が増加すると共に、デジタルカメラやビデオカメラで撮影した動画をPCにダウンロードして編集した後、ウェブに掲載して共有していたユーザが、モバイル機器で動画を撮影し、モバイル機器ですぐに編集して共有することを望んでいる。現在、一部のスマートフォンにおいては、スマートフォンで撮った動画を編集することができる動画編集機能が提供されているが、その機能が非常に制限的で、使いづらいのが実情である。
例えば、Adobe PremireなどのPC動画編集アプリケーションは、PCのような大きなディスプレイとマウスインタフェースが存在する環境には適するが、モバイル機器のような限定されたディスプレイとインプット環境には適さない方式である。また、Jumpcutなどのウェブ動画編集アプリケーションは、UI構成において、プレビュー画面、タイムライン、ストーリーボードパネル、効果パネルなどが平面的に配列されており、モバイル機器などの限定されたディスプレイには適さないUI方式である。
また、高価な装備をユーザが携帯しない限り、撮影される映像でユーザが伝えようとする特定の記号やテキストなどを効果的に挿入することができないため、多少無味乾燥した映像だけが生成されて伝達されることにより、ユーザ志向の映像制作環境が不足しているといえる。例えば、映像通話の場合、発信者と受信者それぞれは、自分の端末を通じて相手側の映像と自分のビュー映像を同時に見ることになる。このとき、映像通話端末の特定のアプリケーションを駆動させない限り、現在の画面状態でユーザが相手側に伝えようとするテキスト、記号などを自分の映像と共に伝送することが非常に難しく構成されている。
さらに、特定のアプリケーションを駆動する場合にも、現在の自分の映像情報にテキスト、記号などが結合された映像が相手に伝達されるのではなく、現在の映像情報とテキスト、記号などのデータが二元的な形で相手側に伝達され、それぞれ独立したアプリケーションによってユーザに提供される。
本発明は、字幕、効果、背景、表情、キャラクターなどを含む特殊効果を、動画コンテンツに応じて場面に自動的に挿入することにより、スマート端末及びPCで高品質の映像コンテンツを生成することができるリアルタイム増強合成技術を用いた映像生成サーバ及び方法を提供することにその目的がある。
本発明の一実施形態によるリアルタイム増強合成技術を用いた映像生成サーバは、ソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び映像コンテンツ編集に付加される特殊効果を含む映像編集データを保存するデータベースと、ユーザによって登録された映像コンテンツを構成する場面に含まれたオブジェクトを認識することによって場面に付加される特殊効果を抽出する抽出モジュールと、場面を構成するオブジェクトのサイズと種類に応じて抽出された特殊効果の場面での設定位置を検出し、設定位置で特殊効果のサイズを算出する特殊効果調整モジュールと、特殊効果調整モジュールによって設定位置とサイズが調整された特殊効果を反映した場面をディスプレイし、ディスプレイされた場面の一つを選んでもらい、これを保存し、選ばれた場面で映像を生成するディスプレイモジュールと、を含む。
また、本発明の他の実施形態による映像生成サーバの映像生成方法は、(A)データベースにソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び映像コンテンツ編集に必要な特殊効果を含む映像編集データを保存する段階と、(B)アイテム管理モジュールで字幕、マスク、顔文字、背景、表情、顔を含む特殊効果を購入して保存する段階と、(C)抽出モジュールでユーザによって登録された映像コンテンツを構成する場面に含まれたオブジェクトを認識して場面に付加される特殊効果を抽出する段階と、(D)特殊効果調整モジュールで場面を構成するオブジェクトのサイズと種類に応じて抽出された特殊効果の設定位置を検出し、設定位置での特殊効果のサイズを算出する段階と、(E)ディスプレイモジュールで特殊効果調整モジュールによって設定位置やサイズが調整された特殊効果を反映した複数の場面をディスプレイし、ディスプレイされた場面の一つを選んでもらい、選ばれた場面で動画を生成する段階、とを含む。
さらに、本発明の他の実施形態による映像生成サーバを含むリアルタイム増強合成技術を用いた映像生成システムは、映像生成サーバから映像生成に必要な一連のプログラムを分散方式で伝達されるスマート端末を含み、スマート端末は映像生成サーバを通じて伝達された映像生成プログラムを通じて映像を構成する場面を分析し、分析結果に応じて場面別の特殊効果を抽出し、場面に含まれたオブジェクトの種類とサイズに応じて抽出された特殊効果の設定位置やサイズを調整して場面に反映させる。
上述した映像生成サーバ及び方法によれば、動画を構成する場面に含まれたオブジェクトを分析して分析結果を基にオブジェクト別に適する特殊効果を抽出し、特殊効果の位置とサイズを自動算出して場面に反映することにより、動画編集をより早く、簡単に行うことができる。
また、スマート端末で最適化されたUI(User Interface)を提供することによって、ユーザが自分のスマート端末でも手軽に動画を編集することができる。
また、字幕、効果、背景、表情、マスク、小物、キャラクター、絵など多様な特殊効果を生成してライブラリに登録し、生成された特殊効果を他のユーザが購入すると、収益を創出できるようにすることもできる。
本発明の効果は、上述した効果に限定されるものではなく、本発明の詳細な説明、または特許請求範囲に記載された発明の構成から推論可能なすべての効果を含むものと理解されなければならない。
本発明の利点及び特徴、そしてそれらを達成する方法は、添付図面と共に詳述されている実施形態を参照すると明確になるが、本発明は以下に開示する実施形態に限定されるものではなく、互いに異なる多様な形態で具現でき、但し、本実施形態は本発明の開示が完全なものとなるようにし、本発明が属する技術分野において通常の知識を有する者に対し、発明の範疇を完全に知らせるために提供するものであり、本発明は請求範囲の範疇によって定義されるものに過ぎない。明細書全体にわたり同一の図面符号は同一の構成要素を指す。
本発明の実施形態を説明するにおいて、公知機能または構成に対する具体的な説明が本発明の要旨を不要に濁しかねないと判断される場合は、その詳細な説明を省略することにする。また、後述する用語は、本発明の実施形態での機能を考慮して定義された用語であって、これはユーザ、運用者の意図または慣例によって変わることがある。したがって、その定義は本明細書全般にわたる内容に基づいて下されなければならない。
図1Aは、本発明の実施形態による映像編集システム(映像生成システム)を示した図である。
本発明の実施形態による映像編集システムは、映像編集サーバ100(映像生成サーバ)、コンテンツライブラリ200、デジタルデバイス300、及びソフトウェア共有プラットフォーム400を含んで構成される。
映像編集サーバ100は、本発明の実施形態で提供する映像編集プログラムを個人のPC、スマートフォンなどを含むデジタルデバイスに分散方式で提供する。デジタルデバイス300は、映像編集サーバ100から編集プログラムが伝達され、これを利用して動画編集を行う。図1Aに示すように、本発明で提供する映像編集プログラムは、映像を構成する画面を分析して分析結果に応じて背景、小物、字幕、表情、マスク、特殊効果などを含む各種の特殊効果を自動的に抽出し、抽出された特殊効果を場面の最適な位置に設定する機能を提供する。これにより、ユーザはスマートフォンでも最適化されたUIを用いて動画を構成する場面それぞれのコンテンツにマッチングされた特殊効果を手軽に追加することで、特殊効果が挿入された編集映像aを生成することができる。
コンテンツライブラリ200は、デジタルデバイス300からユーザが直に生成した創作物(特殊効果)の伝達を受けて保存し、これを映像編集システムに登録されたユーザたちに販売したり、無料で配布できるようにする。図1Bは、本発明の実施形態による創作物(特殊効果)生成ディスプレイを示した図である。図1Bに示すように、映像編集システムに登録されたユーザのうち創作物(特殊効果)を創作できるクリエータは、小物、顔の表情などの特殊効果に含まれるデジタルコンテンツを生成し、これをコンテンツライブラリ200を通じて配布することで収益を創出することができる。
図2Aは、本発明の実施形態による映像編集サーバの大まかな構成を示したブロック図である。
図2Aを参照すると、映像編集サーバ100は、データベース110、抽出モジュール130、特殊効果調整モジュール150及びディスプレイモジュール170を含んで構成される。
本明細書で用いる「モジュール」という用語は、用語が使用された文脈によって、ソフトウェア、ハードウェアまたはその組み合わせを含むことができるものと解釈されなければならない。例えば、ソフトウェアは、機械語、ファームウェア(firmware)、埋め込みコード (embedded code)、及びアプリケーションソフトウェアであることもできる。また他の例として、ハードウェアは、回路、プロセッサ、コンピューター、集積回路、集積回路コア、センサー、メムス(MEMS;Micro−Electro−Mechanical System)、手動デバイス、またはその組合せであることもできる。
データベース110は、映像編集システムに登録するために要求されるユーザの個人情報及び編集する映像コンテンツ、映像編集データなど、本発明による映像編集機能を提供するために必要な一連のデータを保存する。例えば、映像編集データには顔、マスク、小物、キャラクター、背景、特殊効果など様々な特殊効果が含まれる。また、データベース110には場面に含まれたオブジェクトの詳細情報によって、特殊効果をマッチングして保存する。例えば、オブジェクトの詳細情報が、笑う表情であると、花、スマイル、明るい背景などの特殊効果をマッチングし、また、オブジェクトの詳細情報が怒った表情には、角、雷などの特殊効果をオブジェクトの詳細情報にそれぞれマッチングして保存することができる。
抽出モジュール130は、編集する映像コンテンツを構成する場面を分析し、分析結果によって場面に含まれる特殊効果を抽出する。例えば、抽出モジュールは、場面に含まれたオブジェクトの輪郭線及びエッジの認識でオブジェクトの種類を把握し、その結果によって特殊効果を抽出することができる。また、抽出モジュール130は、ユーザが選択した特殊効果のヒストリー情報及び認識されたオブジェクトの種類に応じて場面別に特殊効果を薦めることができる。
特殊効果調整モジュール150は、場面を構成するオブジェクトのサイズと種類によって抽出モジュール130から抽出された特殊効果の場面での設定位置を検出し、設定位置でオブジェクトのサイズに応じて特殊効果のサイズを算出する。特殊効果調整モジュール150は、場面にx、y、z軸を設定し、座標を生成して、オブジェクトのサイズと種類に応じて抽出された特殊効果のサイズと位置を最適化することで、編集された映像品質を向上させることができる。
ディスプレイモジュール170は、特殊効果調整モジュールによって、設定位置とサイズが調整された特殊効果を反映した場面をディスプレイし、ディスプレイされた場面のうち一つを選んでもらって保存し、場面に最適化した特殊効果が適用された編集映像を生成できるようにする。また、実施形態において映像編集サーバ100は、マスク、字幕、顔文字、背景、表情、顔を含む特殊効果を購入して保存するアイテム管理モジュール(図示せず)をさらに含むことができる。
図2Bは実施形態による場面コンテンツに応じて抽出された特殊効果が反映された図である。
図2Bに示すように、実施形態では、特定の表情と特定の特殊効果とをマッチングして、編集が必要な場面で特定の表情が認識される場合、これにマッチングされた特殊効果が反映されるようにする。例えば、場面でオブジェクトが人と認知され、人物オブジェクトのエッジ及び輪郭線検出により、人物オブジェクトの笑う表情が認識されると、笑う表情にマッチングされた特殊効果が反映されるようにする。また他の例として、目を瞑ったり、しかめた表情が検出されると、それぞれの表情にマッチングされた特殊効果が場面に反映されるようにすることができる。
図3Aは実施形態による映像編集サーバ100のより具体的な構成を示した図である。
図3Aを参照すると、映像編集サーバ100の抽出モジュール130は、オブジェクト認識部131と特殊効果抽出部133を含んで構成することができ、特殊効果調整モジュール150は、位置設定部151及びサイズ算出部153を含んで構成することができ、ディスプレイモジュール170は、シミュレーション部171及び映像生成部173を含んで構成することができる。
抽出モジュール130のオブジェクト認識部131は、場面に含まれたオブジェクトのサイズと種類を認識し、認識されたオブジェクトが人であれば、認識された人の表情、動作を含む詳細情報を認識する。例えば、オブジェクト認識部131は、オブジェクトの輪郭線及びエッジの検出後、特徴点を抽出し、抽出された特徴点を基に人物オブジェクトの表情及び動作を含むオブジェクトの詳細情報を認識することができる。
特殊効果抽出部133は、認識されたオブジェクトの詳細情報に対応する場面別に特殊効果を抽出する。例えば、オブジェクト認識部131で認識された人物オブジェクトの表情が泣く表情であれば、上記の表情に既にマッチングされた涙、雲、雨、泣く表情のキャラクターなど、オブジェクトの詳細情報にマッチングされた特殊効果を抽出することができる。また、特殊効果抽出部133は、オブジェクトの詳細情報とユーザ別特殊効果と利用ヒストリーとを反映して、ユーザが好む特殊効果を薦めることができる。
特殊効果調整モジュール150の位置設定部151は、抽出された特殊効果及びオブジェクトの詳細情報に応じて、場面で特殊効果が反映される最適な位置を設定する。例えば、位置設定部151は、オブジェクトの詳細情報と特殊効果のサイズや種類を考慮して特殊効果が反映される最適な位置を設定することができる。具体的に、位置設定部151は、帽子、ヘアスタイルなどの特殊効果であれば、オブジェクトの頭の部分のエッジと輪郭線が特殊効果(帽子、ヘアスタイル)のエッジと輪郭線に重なるようにオブジェクトの最適な位置を設定することができる。
サイズ算出部153は、設定された位置でオブジェクトのサイズ及び種類を考慮した特殊効果の最適なサイズを算出する。例えば、サイズ算出部153は、場面に含まれるオブジェクトのサイズと特殊効果のサイズ及びオブジェクトと特殊効果のサイズの割合などを基に適する特殊効果の最適なサイズを演算することができる。
ディスプレイモジュール170のシミュレーション部171は、映像を構成する各場面に反映された特殊効果をシミュレーションする。特殊効果のシミュレーション後、特殊効果が適用された場面のうち一つを選んでもらい保存する。映像生成部173は、保存された場面を用いて特殊効果が適用された映像コンテンツを生成する。
図3Bは、本発明の実施形態による特殊効果の適用を示した図である。
図3Bの(a)に示すように、映像編集サーバの抽出モジュール130では、映像を構成する場面に含まれたオブジェクトの輪郭線とエッジを認識してオブジェクトが人の顔と認識されると、顔の特徴点の抽出を通じて表情を認識することができる。その後、(b)に示すように、認識された表情にマッチングする特殊効果を抽出し、(c)に示すように、特殊効果が適用される最適な位置を設定する。例えば、実施形態では、オブジェクトを含む場面やオブジェクトの位置を3軸(x、y、z軸)座標化した後、特殊効果の最適な位置を設定することができる。位置設定後、(d)に示すように、特殊効果の最適なサイズを導出して場面に適用する。本開示を通じて、実施形態のように場面に含まれたオブジェクトが人であれば、人の表情を認識し、認識された表情に既にマッチングされた特殊効果を抽出し、オブジェクトのサイズに応じて特殊効果のサイズと位置を最適に調整して適用することによって、背景、マスク、小物などを含む特殊効果をそれぞれの場面に精巧に反映することで、編集された動画品質を向上させることができる。
以下、本発明による映像編集方法について順に説明する。以下の映像編集方法の作用(機能)は、映像編集サーバ及びシステム上の機能と本質的に同じものであるので、図1乃至図3Bと重複する説明は省略することにする。
図4は一実施形態による映像編集方法(映像生成方法)のデータ処理の流れを示したフローチャートである。
S410段階では、スマート端末など、デジタルデバイスで編集する映像データをアップロードする。
S420段階では、抽出モジュール130で編集する動画を構成する場面を分析する。例えば、場面に含まれたオブジェクトを認識し、認識されたオブジェクトが人であれば、人物オブジェクトの動作、表情などオブジェクトの詳細情報を検出する。
S430段階において、抽出モジュール130で詳細情報の検出結果に応じて人物オブジェクトに適用される特殊効果を抽出する。例えば、人物オブジェクトの表情が笑う表情で検索されれば、スマイル、花の背景、気持ち良いなどの字幕などの特殊効果を抽出することができる。抽出される特殊効果は、人物オブジェクトの表情や動作によってマッチングされ、これを保存することができる。また、ユーザ別特殊効果の使用ヒストリーに応じて、好みの特殊効果を薦めることができる。
S440段階では、特殊効果調整モジュール150で場面を構成するオブジェクトのサイズと種類に応じて抽出された特殊効果の場面での設定位置を検出し、設定位置での特殊効果のサイズを算出する。
S450段階では、設定位置に特殊効果が適用された複数の場面がティスプレイされ、ディスプレイされた場面のうち一つを選んでもらい、これを保存する。
S460段階では、特殊効果が適用された保存済みの場面を利用して動画を生成する。
図5乃至図8は、本発明の実施形態による映像編集サーバによって提供される編集過程及び動画の結果物のディスプレイを示した図である。
図5及び図6は、本発明の実施形態による特殊効果の抽出及び適用過程のディスプレイを示した図である
図5の(a)、(b)に示すように、スマートフォンまたは個人PCで編集する映像ファイルを開くと、映像を構成する場面に含まれたオブジェクトが三次元にディスプレイされる。その後、(c)に示すように、ディスプレイされたオブジェクトの輪郭線とエッジを検出し、特徴点(1、2)を検出してオブジェクトの表情を認識する。すると、(d)に示すように、認識された表情によってオブジェクトに適用可能な特殊効果(1)が抽出されてディスプレイされ、場面で座標軸を設定することにより抽出された特殊効果(1)の最適な位置を検出する。
図6に示す他の実施形態について説明すると、図6の(e)部分に示すように、特定特殊効果(1)を呼び寄せると、特殊効果(1)の最適な位置を検出するために、(f)に示すように、オブジェクトを含む場面に座標を設定してオブジェクトと特殊効果の種類によって適用される最適位置が演算される。その後、(g)に示すように、特定のオブジェクトが適用される最適な位置が検出され、特殊効果が設定される。その後、(h)に示すように、特殊効果のサイズを調整し、設定位置をより細かく調整して特殊効果の反映を完了する。
図7は本発明の実施形態による映像編集システムに登録されたクリエータ達が生成した多様な特殊効果及び特殊効果が映像場面に適用された例を示した図である。
図7に示すように、動画に特殊効果で付加される特殊効果はイメージ、マスク、表情、背景、字幕、小物、キャラクターなどがあり、非常に多様に演出でき、動画を構成するオブジェクトの表情と動作、使用言語、サイズなどオブジェクトの詳細情報に応じて適切な特殊効果が自動的に推薦されて場面に反映することができる。
図8は本発明の実施形態によるクリエータ達によって生成された特殊効果が映像編集サーバを通じて配布、または販売されるUIディスプレイを示した図である。
図8に示すように、クリエータ達は直に特殊効果を生成し、これを映像編集システムに登録されたユーザに販売することができ、ユーザたちは様々な特殊効果のうち、自分が使う特殊効果を購入して自分の動画編集に利用できる。
以上のような映像生成サーバ及び方法は、動画を構成する場面に含まれたオブジェクトを分析し、分析結果を基にオブジェクト別に適する特殊効果を抽出し、特殊効果の位置とサイズを自動算出して場面に反映することによって、動画編集をより早く、且つ容易に行うことができるようにする。また、スマート端末で最適化されたUIを提供することにより、ユーザが自分のスマート端末でも手軽に動画を編集できるようにする。また、字幕、効果、背景、表情、マスク、小物、キャラクター、絵など多様な特殊効果を生成し、ライブラリに登録するにおいては、生成された特殊効果を他のユーザが購入すると、収益を創出することができる。
本発明の内容は、例示に過ぎず、特許請求範囲で請求する請求の要旨から外れることなく、当該技術分野において通常の知識を有する者によって多様に変更実施することができるため、開示された内容の保護範囲は上述した特定の実施形態に限定されない。
110 データベース
130 抽出モジュール
150 特殊効果調整モジュール
170 ディスプレイモジュール
130 抽出モジュール
150 特殊効果調整モジュール
170 ディスプレイモジュール
Claims (10)
- リアルタイム増強合成技術を用いた映像生成サーバにおいて、
ソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び前記映像コンテンツの編集に付加される特殊効果を含む映像編集データを保存するデータベースと、
前記ユーザによって登録された映像コンテンツを構成する場面に含まれたオブジェクトを認識して前記場面に付加される特殊効果を抽出する抽出モジュールと、
前記場面を構成するオブジェクトのサイズと種類に応じて、前記抽出された特殊効果の前記場面での設定位置を検出し、前記設定位置で前記特殊効果のサイズを算出する特殊効果調整モジュールと、
前記特殊効果調整モジュールによって、設定位置とサイズが調整された前記特殊効果を反映した場面をディスプレイし、ディスプレイされた場面の一つを選んでもらい、これを保存し、選択された場面で映像を生成するディスプレイモジュールと、を含む映像生成サーバ。 - 前記抽出モジュールは、前記場面に含まれたオブジェクトのサイズと種類を認識し、認識されたオブジェクトが人物であれば、オブジェクトのエッジや輪郭線の検出を通じ、前記認識された人の表情、動作を含むオブジェクトの詳細情報を認識するオブジェクト認識部と、
前記認識されたオブジェクトの詳細情報にマッチングされた場面別の特殊効果を抽出する特殊効果抽出部と、を含むことを特徴とする請求項1に記載の映像生成サーバ。 - 前記特殊効果調整モジュールは、前記の抽出された特殊効果及びオブジェクトの種類に応じて前記場面で特殊効果が反映される位置を設定する位置設定部と、
前記設定された位置でオブジェクト及び特殊効果のサイズ及び種類と特殊効果とオブジェクトのサイズの割合に応じて特殊効果の適用に最適なサイズを算出するサイズ算出部と、を含むことを特徴とする請求項1に記載の映像生成サーバ。 - 前記映像生成サーバは、マスク、字幕、特殊効果、顔文字、背景、表情、顔を含む特殊効果を購入して保存するアイテム管理モジュールをさらに含むことを特徴とする請求項1に記載の映像生成サーバ。
- 前記抽出モジュールは、ユーザによって選択された特殊効果とヒストリー情報及び認識されたオブジェクトの種類に応じて場面別に特殊効果を推薦することを特徴とする請求項1または2に記載の映像生成サーバ。
- データベース、抽出モジュール、特殊効果調整モジュール、ディスプレイモジュール、アイテム管理モジュールを含む映像生成サーバでの映像生成方法において、
(A)前記データベースに、ソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び前記映像コンテンツの編集に必要な特殊効果を含む映像編集データを保存する段階と、
(B)前記アイテム管理モジュールで、字幕、マスク、特殊効果、顔文字、背景、表情、顔を含む特殊効果を購入して保存する段階と、
(C)前記抽出モジュールで、ユーザによって登録された映像コンテンツを構成する場面に含まれたオブジェクトを認識して前記場面に付加される特殊効果を抽出する段階と、
(D)前記特殊効果調整モジュールで、場面を構成するオブジェクトのサイズと種類に応じて前記の抽出された特殊効果の設定位置を検出し、前記設定位置での前記特殊効果のサイズを算出する段階と、
(E)前記ディスプレイモジュールで、前記特殊効果調整モジュールによって設定位置とサイズが調整された前記特殊効果を反映した複数の場面をディスプレイし、ディスプレイされた場面のうち一つを選んでもらい、選択された場面で動画を生成する段階と、を含む映像生成方法。 - 前記(C)の場面に付加される特殊効果を抽出する段階は、
前記場面に含まれたオブジェクトの輪郭線及びエッジを検出してサイズと種類を認識する段階と、
前記認識されたオブジェクトが人であれば、前記認識されたオブジェクトの特徴点を検出することにより、人の表情、動作を含む詳細情報を認識する段階と、
前記認識されたオブジェクトの詳細情報にマッチングされた場面別の特殊効果を抽出する段階と、を含むことを特徴とする請求項6に記載の映像生成方法。 - 前記(C)の場面に付加される特殊効果を抽出する段階は、
ユーザが選択した特殊効果ヒストリー情報及び認識されたオブジェクトの種類に応じて場面別の特殊効果を推薦することを特徴とする請求項6または7に記載の映像生成方法。 - 映像生成サーバを含むリアルタイム増強合成技術を用いた映像生成システムにおいて、
前記映像生成サーバから映像生成に必要な一連のプログラムを分散方式で伝達されるスマート端末をさらに含み、
前記スマート端末は、前記映像生成サーバを通じて伝達された映像生成プログラムを通じて映像を構成する場面を分析し、分析結果によって場面別特殊効果を抽出し、前記場面に含まれたオブジェクトの種類とサイズによって抽出された特殊効果の設定位置とサイズを調整して前記場面に反映することを特徴とする映像生成システム。 - 前記映像生成サーバは、
ソーシャルメディアプラットフォームに登録されたユーザの個人情報、編集する映像コンテンツ及び前記映像コンテンツの編集に付加される特殊効果を含む映像編集データを保存するデータベースと、
前記ユーザによって登録された映像コンテンツを構成する場面に含まれたオブジェクトを認識し、前記場面に付加される特殊効果を抽出する抽出モジュールと、
前記場面を構成するオブジェクトのサイズと種類に応じて、前記抽出された特殊効果の前記場面での設定位置を検出し、前記設定位置で前記特殊効果のサイズを算出する特殊効果調整モジュールと、
前記特殊効果調整モジュールによって、設定位置とサイズが調整された前記特殊効果を反映した場面をディスプレイし、ディスプレイされた場面のうち一つを選んでもらい、これを保存し、選択された場面で映像を生成するディスプレイモジュールと、を含むことを特徴とする請求項9に記載の映像生成システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2017-0078552 | 2017-06-21 | ||
KR1020170078552A KR101894956B1 (ko) | 2017-06-21 | 2017-06-21 | 실시간 증강 합성 기술을 이용한 영상 생성 서버 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019009754A true JP2019009754A (ja) | 2019-01-17 |
Family
ID=64132135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017144280A Pending JP2019009754A (ja) | 2017-06-21 | 2017-07-26 | リアルタイム増強合成技術を用いた映像生成サーバ、映像生成システム及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2019009754A (ja) |
KR (1) | KR101894956B1 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111147766A (zh) * | 2019-11-21 | 2020-05-12 | 深圳壹账通智能科技有限公司 | 特效视频合成方法、装置、计算机设备和存储介质 |
CN111246307A (zh) * | 2020-01-16 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 一种虚拟礼物生成的方法、相关装置、设备及存储介质 |
CN111783187A (zh) * | 2019-04-03 | 2020-10-16 | 中山市京灯网络科技有限公司 | 一种亮化共享平台应用系统 |
JP2021022811A (ja) * | 2019-07-26 | 2021-02-18 | 株式会社オレンジテクラボ | 動画像処理装置、動画像処理方法及び動画像処理プログラム |
WO2021174389A1 (zh) * | 2020-03-02 | 2021-09-10 | 深圳市大疆创新科技有限公司 | 视频的处理方法和装置 |
CN113382275A (zh) * | 2021-06-07 | 2021-09-10 | 广州博冠信息科技有限公司 | 直播数据的生成方法、装置、存储介质及电子设备 |
CN115002336A (zh) * | 2021-11-30 | 2022-09-02 | 荣耀终端有限公司 | 视频信息的生成方法、电子设备及介质 |
WO2023040749A1 (zh) * | 2021-09-16 | 2023-03-23 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
JP2023538981A (ja) * | 2021-07-27 | 2023-09-13 | ダナル エンターテインメント カンパニー リミテッド | エモーティコン生成装置 |
WO2024094158A1 (zh) * | 2022-11-04 | 2024-05-10 | 北京字跳网络技术有限公司 | 特效处理方法、装置、设备及存储介质 |
KR102695008B1 (ko) * | 2021-07-27 | 2024-08-13 | 주식회사 다날엔터테인먼트 | 이모티콘 생성 장치 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102148006B1 (ko) * | 2019-04-30 | 2020-08-25 | 주식회사 카카오 | 동영상에 특수 이펙트를 제공하는 방법 및 장치 |
WO2020256403A1 (ko) * | 2019-06-19 | 2020-12-24 | (주) 애니펜 | 차량 내부 영상을 기반으로 콘텐츠를 저작하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
CN111757135B (zh) | 2020-06-24 | 2022-08-23 | 北京字节跳动网络技术有限公司 | 直播互动方法、装置、可读介质及电子设备 |
CN111935491B (zh) | 2020-06-28 | 2023-04-07 | 百度在线网络技术(北京)有限公司 | 直播的特效处理方法、装置以及服务器 |
US11871138B2 (en) * | 2020-10-13 | 2024-01-09 | Grass Valley Canada | Virtualized production switcher and method for media production |
CN116349233A (zh) * | 2021-01-20 | 2023-06-27 | 三星电子株式会社 | 用于确定视频中的运动显著性和视频回放风格的方法和电子装置 |
CN113709521B (zh) * | 2021-09-18 | 2023-08-29 | 物芯智能科技有限公司 | 一种根据视频内容自动匹配背景的系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001306342A (ja) * | 2000-04-20 | 2001-11-02 | Victor Co Of Japan Ltd | ネットワークでのデジタルデータのエフェクト処理方法およびシステム、エフェクトサーバおよびユーザ端末とデジタルデータのエフェクト処理プログラムを記録した記録媒体、エフェクトサーバおよびユーザ端末における処理プログラムを記録した記録媒体 |
JP2004112112A (ja) * | 2002-09-13 | 2004-04-08 | Sony Corp | 情報処理装置 |
JP2008084213A (ja) * | 2006-09-28 | 2008-04-10 | Sony Corp | 画像処理装置、撮像装置、画像処理方法およびプログラム |
JP2011103574A (ja) * | 2009-11-11 | 2011-05-26 | Nec Biglobe Ltd | 動画画像処理システム、サーバ、動画画像の処理方法、およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3679744B2 (ja) * | 2001-09-26 | 2005-08-03 | 三洋電機株式会社 | 画像合成方法および装置 |
JP2008135923A (ja) * | 2006-11-28 | 2008-06-12 | Taiwan Mukojo Kagi Kofun Yugenkoshi | リアルタイムに相互作用する映像の制作方法、映像の制作装置、および映像の制作システム |
KR101707707B1 (ko) * | 2012-12-14 | 2017-02-16 | 한국전자통신연구원 | 인체 모델을 이용한 가상 아이템 피팅 방법 및 가상 아이템의 피팅 서비스 제공 시스템 |
-
2017
- 2017-06-21 KR KR1020170078552A patent/KR101894956B1/ko active IP Right Grant
- 2017-07-26 JP JP2017144280A patent/JP2019009754A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001306342A (ja) * | 2000-04-20 | 2001-11-02 | Victor Co Of Japan Ltd | ネットワークでのデジタルデータのエフェクト処理方法およびシステム、エフェクトサーバおよびユーザ端末とデジタルデータのエフェクト処理プログラムを記録した記録媒体、エフェクトサーバおよびユーザ端末における処理プログラムを記録した記録媒体 |
JP2004112112A (ja) * | 2002-09-13 | 2004-04-08 | Sony Corp | 情報処理装置 |
JP2008084213A (ja) * | 2006-09-28 | 2008-04-10 | Sony Corp | 画像処理装置、撮像装置、画像処理方法およびプログラム |
JP2011103574A (ja) * | 2009-11-11 | 2011-05-26 | Nec Biglobe Ltd | 動画画像処理システム、サーバ、動画画像の処理方法、およびプログラム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783187A (zh) * | 2019-04-03 | 2020-10-16 | 中山市京灯网络科技有限公司 | 一种亮化共享平台应用系统 |
CN111783187B (zh) * | 2019-04-03 | 2023-12-22 | 京灯(广东)信息科技有限公司 | 一种亮化共享平台应用系统 |
JP7374430B2 (ja) | 2019-07-26 | 2023-11-07 | 株式会社オレンジテクラボ | 動画像処理装置、動画像処理方法及び動画像処理プログラム |
JP2021022811A (ja) * | 2019-07-26 | 2021-02-18 | 株式会社オレンジテクラボ | 動画像処理装置、動画像処理方法及び動画像処理プログラム |
CN111147766A (zh) * | 2019-11-21 | 2020-05-12 | 深圳壹账通智能科技有限公司 | 特效视频合成方法、装置、计算机设备和存储介质 |
CN111246307A (zh) * | 2020-01-16 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 一种虚拟礼物生成的方法、相关装置、设备及存储介质 |
CN111246307B (zh) * | 2020-01-16 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 一种虚拟礼物生成的方法、相关装置、设备及存储介质 |
WO2021174389A1 (zh) * | 2020-03-02 | 2021-09-10 | 深圳市大疆创新科技有限公司 | 视频的处理方法和装置 |
CN113382275A (zh) * | 2021-06-07 | 2021-09-10 | 广州博冠信息科技有限公司 | 直播数据的生成方法、装置、存储介质及电子设备 |
JP2023538981A (ja) * | 2021-07-27 | 2023-09-13 | ダナル エンターテインメント カンパニー リミテッド | エモーティコン生成装置 |
JP7465487B2 (ja) | 2021-07-27 | 2024-04-11 | ダナル エンターテインメント カンパニー リミテッド | エモーティコン生成装置 |
KR102695008B1 (ko) * | 2021-07-27 | 2024-08-13 | 주식회사 다날엔터테인먼트 | 이모티콘 생성 장치 |
WO2023040749A1 (zh) * | 2021-09-16 | 2023-03-23 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN115002336A (zh) * | 2021-11-30 | 2022-09-02 | 荣耀终端有限公司 | 视频信息的生成方法、电子设备及介质 |
WO2024094158A1 (zh) * | 2022-11-04 | 2024-05-10 | 北京字跳网络技术有限公司 | 特效处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR101894956B1 (ko) | 2018-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101894956B1 (ko) | 실시간 증강 합성 기술을 이용한 영상 생성 서버 및 방법 | |
CN109819313B (zh) | 视频处理方法、装置及存储介质 | |
US11861936B2 (en) | Face reenactment | |
US12087086B2 (en) | Method for identifying, ordering, and presenting images according to expressions | |
WO2022001593A1 (zh) | 视频生成方法、装置、存储介质及计算机设备 | |
KR102616013B1 (ko) | 맞춤형 텍스트 메시지를 갖는 개인화 비디오 생성 시스템 및 방법 | |
US20210264139A1 (en) | Creating videos with facial expressions | |
US11657557B2 (en) | Method and system for generating data to provide an animated visual representation | |
US10373348B2 (en) | Image processing apparatus, image processing system, and program | |
US11842433B2 (en) | Generating personalized videos with customized text messages | |
WO2019114328A1 (zh) | 一种基于增强现实的视频处理方法及其装置 | |
US11895260B2 (en) | Customizing modifiable videos of multimedia messaging application | |
KR20210118428A (ko) | 개인화된 비디오를 제공하기 위한 시스템들 및 방법들 | |
CN114245099B (zh) | 视频生成方法、装置、电子设备以及存储介质 | |
CN113542624A (zh) | 生成商品对象讲解视频的方法及装置 | |
US20180114546A1 (en) | Employing live camera feeds to edit facial expressions | |
US12047624B2 (en) | Systems and methods for generating new content segments based on object name identification | |
WO2023130715A1 (zh) | 一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
KR20210134229A (ko) | 이미지 증강을 위한 방법 및 전자 장치 | |
US20240193836A1 (en) | Method and system for customization of a virtual avatar | |
WO2018018076A1 (en) | Creating videos with facial expressions | |
KR20200076234A (ko) | 3차원 vr 콘텐츠 제작 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190416 |