JP6783479B1 - 動画生成プログラム、動画生成装置及び動画生成方法 - Google Patents
動画生成プログラム、動画生成装置及び動画生成方法 Download PDFInfo
- Publication number
- JP6783479B1 JP6783479B1 JP2019157270A JP2019157270A JP6783479B1 JP 6783479 B1 JP6783479 B1 JP 6783479B1 JP 2019157270 A JP2019157270 A JP 2019157270A JP 2019157270 A JP2019157270 A JP 2019157270A JP 6783479 B1 JP6783479 B1 JP 6783479B1
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- still
- category
- generation model
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 85
- 238000013145 classification model Methods 0.000 claims description 33
- 241000556720 Manga Species 0.000 claims description 10
- 241001465754 Metazoa Species 0.000 claims description 9
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims 2
- 238000013527 convolutional neural network Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract description 26
- 230000013016 learning Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 102100033814 Alanine aminotransferase 2 Human genes 0.000 description 1
- 101710096000 Alanine aminotransferase 2 Proteins 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/80—2D [Two Dimensional] animation, e.g. using sprites
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
図1は、実施の形態1における動画生成装置1の構成を示すブロック図であり、図2は、動画生成装置1の機能ブロック図である。動画生成装置1は、制御部10、画像処理部11、記憶部12、表示部13、操作部14、通信部15及び読取部16を備える。なお動画生成装置1の動作について以下では、1台のコンピュータによる動作として説明するが、複数のコンピュータによって処理を分散するようにして構成されてもよい。
実施の形態2では、静止画像を含まないコンテンツから動画像データを生成する。実施の形態2における動画生成装置1の構成は、具体的な処理手順以外は、実施の形態1における動画生成装置1と同様であるから、共通する構成については同一の符号を付して詳細な説明を省略する。
実施の形態3における動画生成装置1は、1つのコンテンツから複数の静止画像を抽出して動画像データを生成する。実施の形態3における動画生成装置1の構成は、具体的な処理手順以外は、実施の形態1における動画生成装置1と同様であるから、共通する構成については同一の符号を付して詳細な説明を省略する。
実施の形態4における動画生成装置1は、コンテンツとして漫画又はイラストから動画像データを生成する。図15は、実施の形態4における動画生成装置1の構成を示すブロック図であり、図16は、実施の形態4における動画生成装置1の機能ブロック図である。実施の形態4における動画生成装置1の構成は、音声出力モデル4M及び具体的な処理手順以外は、実施の形態1における動画生成装置1と同様であるから、共通する構成については同一の符号を付して詳細な説明を省略する。
実施の形態5では、動画生成装置1は、生成した動画像のデータを、第三者から評価が可能なネットワーク、例えばSNS上にアップロードし、評価を受け付ける。実施の形態5における動画生成装置1の構成は、詳細な処理手順以外は実施の形態1の動画生成装置1と同様であるから、共通する構成については同一の符号を付して詳細な説明を省略する。
実施の形態6では、動画生成装置1は、受け付けるコンテンツに含まれるテキストに基づいて、該テキストよりも長いテキストを読み上げる音声を含む音声付き動画像を生成する。図21は、実施の形態6における動画生成装置1の構成を示すブロック図であり、図22は、実施の形態6における動画生成装置1の機能ブロック図である。実施の形態6における動画生成装置1の構成は、テキスト生成モデル5M及びこれに関する手順以外は、実施の形態1から実施の形態4における動画生成装置1と同様であるから、共通する構成については同一の符号を付して詳細な説明を省略する。
10 制御部
101 受付部
102 カテゴリー決定部
103 モデル選択部
104 音声生成部
105 動画生成部
11 画像処理部
12 記憶部
1P,31P 動画生成プログラム
1M,3M 動画生成モデル
12M 識別モデル
2M 分類モデル
4M 音声出力モデル
3 記録媒体
5M テキスト生成モデル
Claims (10)
- 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含むコンテンツを受け付け、
受け付けたコンテンツに含まれるテキスト又は静止画像に基づいてカテゴリーを決定し、
決定されたカテゴリーに対応する前記動画生成モデルを選択し、
選択された前記動画生成モデルへ、前記コンテンツ中の静止画像を入力して動画像を生成し、
受け付けた前記コンテンツに含まれるテキストから音声データを生成し、
生成された音声データを、生成された動画像へ同期させた音声つき動画像を生成する
処理を実行させる動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含むコンテンツを受け付け、
受け付けたコンテンツに含まれるテキスト又は静止画像に基づいてカテゴリーを決定し、
決定されたカテゴリーに対応する前記動画生成モデルを選択し、
選択された前記動画生成モデルへ、前記コンテンツ中の静止画像を入力して動画像を生成させ、
前記動画生成モデルは、静止画像が入力された場合に動画像を生成するように定義された畳み込みニューラルネットワークを含む動画生成モデルに対し、動画像が入力された場合に、前記動画生成モデルから出力される動画像であるか、又は前記動画生成モデルによって生成されたものでない基準動画像であるかを識別するように定義されたニューラルネットワークを含む識別モデルを用い、
所定の基準を満たすまで前記動画生成モデル及び識別モデル夫々の前記ニューラルネットワークのパラメータを相互に更新することによって、カテゴリー別に学習済みである
動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含むコンテンツを受け付け、
受け付けたコンテンツ中の静止画像を前記動画生成モデルへ入力して生成された第1動画像を記憶部に記憶し、
前記コンテンツ中のテキストに基づいてカテゴリーを決定し、
決定されたカテゴリーに対応する第2静止画像を前記コンテンツ外から取得し、
決定されたカテゴリーに対応する前記動画生成モデルを選択し、
選択された前記動画生成モデルへ、前記第2静止画像を入力して第2動画像を生成し、
前記第1動画像と前記第2動画像とを結合する
処理を実行させる動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含むコンテンツを受け付け、
受け付けた前記コンテンツから複数の静止画像を抽出し、
抽出された複数の静止画像毎に、該静止画像に基づくカテゴリーを決定し、
決定されたカテゴリー夫々に対応する前記動画生成モデルを選択し、
選択された前記動画生成モデル夫々に、前記複数の静止画像の内の対応する静止画像を入力することによって複数の動画像を生成し、
生成された複数の動画像を結合する
処理を実行させる動画生成プログラム。 - 前記テキストは、前記コンテンツに含まれる前記静止画像に対応するセリフ、記事、又はSNSに投稿された文章である
請求項1から請求項4のいずれか1項に記載の動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含む漫画であるコンテンツを受け付け、
受け付けた漫画に含まれるセリフ又は静止画像に基づいてカテゴリーを決定し、
決定されたカテゴリーに対応する前記動画生成モデルを選択し、
選択された前記動画生成モデルへ、前記漫画の静止画像を入力して動画像を生成し、
漫画のセリフを入力した場合に前記セリフに対する音声を出力するよう学習された音声出力モデルを、異なるカテゴリー別に記憶しておき、
受け付けた漫画のセリフを、決定されたカテゴリーに対応する音声出力モデルへ入力して音声を生成し、
生成された音声を、生成された動画像に同期させた音声つき動画像を生成する
処理を実行させる記載の動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に記憶してあるコンピュータに、
テキスト及び静止画像を含む漫画であるコンテンツを受け付け、
漫画のセリフを入力した場合に前記セリフに対する音声を出力するよう学習された音声出力モデルを、異なるカテゴリー別に記憶しておき、
受け付けた漫画に含まれる第1コマの第1セリフ又は第1静止画像に基づいて第1カテゴリーを決定し、
決定された第1カテゴリーに対応する前記動画生成モデルへ、前記第1静止画像を入力して第1動画像を生成し、
前記第1コマに連続する第2コマの第2セリフ又は第2静止画像に基づいて第2カテゴリーを決定し、
決定された第2カテゴリーに対応する前記動画生成モデルへ、前記第2静止画像を入力して第2動画像を生成し、
前記第1セリフを、前記第1カテゴリーに対応する前記音声出力モデルへ入力して第1音声を生成し、
前記第2セリフを、前記第2カテゴリーに対応する前記音声出力モデルへ入力して第2音声を生成し、
生成された前記第1音声を前記第1動画像へ同期させた第1の音声付き動画像と、前記第2音声を前記第2動画像へ同期させた第2の音声付き動画像とを結合させる
処理を実行させる記載の動画生成プログラム。 - 前記コンピュータに、
静止画像が入力された場合に、前記静止画像に写っている人物、動物又は移動体を含む被写体によってカテゴリーを分類するように学習された分類モデルへ、受け付けられた前記コンテンツに含まれる静止画像を入力することによってカテゴリーを決定する
処理を実行させる請求項1から請求項7のいずれか1項に記載の動画生成プログラム。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に複数記憶する記憶部と、
テキスト及び静止画像を含むコンテンツを受け付ける受付部と、
受け付けたコンテンツに含まれるテキスト又は静止画像に基づいてカテゴリーを決定する決定部と、
決定されたカテゴリーに対応する前記動画生成モデルを選択する選択部と、
選択された前記動画生成モデルへ、前記コンテンツ中の静止画像を入力して動画像を生成する動画像生成部と、
受け付けた前記コンテンツに含まれるテキストから音声データを生成する音声生成部と、
生成された音声データを、生成された動画像へ同期させた音声つき動画像を生成する生成部と
を備える動画生成装置。 - 静止画像が入力された場合に、前記静止画像に基づく動画像を生成して出力するように学習された動画生成モデルを、異なるカテゴリー別に複数記憶しておき、
テキスト及び静止画像を含むコンテンツを受け付け、
受け付けたコンテンツに含まれるテキスト又は静止画像に基づいてカテゴリーを決定し、
決定されたカテゴリーに対応する前記動画生成モデルを選択し、
選択された前記動画生成モデルへ、前記コンテンツ中の静止画像を入力して動画像を生成し、
受け付けた前記コンテンツに含まれるテキストから音声データを生成し、
生成された音声データを、生成された動画像へ同期させた音声つき動画像を生成する
処理を含む動画生成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019157270A JP6783479B1 (ja) | 2019-08-29 | 2019-08-29 | 動画生成プログラム、動画生成装置及び動画生成方法 |
PCT/JP2020/031391 WO2021039561A1 (ja) | 2019-08-29 | 2020-08-20 | 動画生成方法、動画生成装置及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019157270A JP6783479B1 (ja) | 2019-08-29 | 2019-08-29 | 動画生成プログラム、動画生成装置及び動画生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6783479B1 true JP6783479B1 (ja) | 2020-11-11 |
JP2021033961A JP2021033961A (ja) | 2021-03-01 |
Family
ID=73043515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019157270A Expired - Fee Related JP6783479B1 (ja) | 2019-08-29 | 2019-08-29 | 動画生成プログラム、動画生成装置及び動画生成方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6783479B1 (ja) |
WO (1) | WO2021039561A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023062829A1 (ja) * | 2021-10-15 | 2023-04-20 | 三菱電機株式会社 | 状態検知システム、状態検知方法および状態検知プログラム |
WO2023214826A1 (ko) * | 2022-05-05 | 2023-11-09 | 유한회사 닥터다비드 | 집단 지성을 이용한 정보 처리 시스템 및 그 방법 |
JP7431373B1 (ja) | 2023-05-18 | 2024-02-14 | 株式会社メディアドゥ | デジタルコンテンツ提供方法、デジタルコンテンツ提供システム及びプログラム |
JP7329293B1 (ja) * | 2023-06-09 | 2023-08-18 | Snafty株式会社 | 情報処理装置、方法、プログラム、およびシステム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008118481A (ja) * | 2006-11-06 | 2008-05-22 | Canon Inc | 画像記録装置、画像記録方法、プログラム及び記憶媒体 |
JP6711044B2 (ja) * | 2016-03-16 | 2020-06-17 | カシオ計算機株式会社 | 画像処理装置、表示装置、アニメーション生成方法及びプログラム |
JP2019204476A (ja) * | 2018-05-17 | 2019-11-28 | 株式会社Preferred Networks | 画像生成装置、画像生成方法及びプログラム |
-
2019
- 2019-08-29 JP JP2019157270A patent/JP6783479B1/ja not_active Expired - Fee Related
-
2020
- 2020-08-20 WO PCT/JP2020/031391 patent/WO2021039561A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2021039561A1 (ja) | 2021-03-04 |
JP2021033961A (ja) | 2021-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6783479B1 (ja) | 動画生成プログラム、動画生成装置及び動画生成方法 | |
Habibie et al. | Learning speech-driven 3d conversational gestures from video | |
CN111382352B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN110782900B (zh) | 协作ai讲故事 | |
CN102207950B (zh) | 电子装置和图像处理方法 | |
US11514634B2 (en) | Personalized speech-to-video with three-dimensional (3D) skeleton regularization and expressive body poses | |
CN113569088B (zh) | 一种音乐推荐方法、装置以及可读存储介质 | |
KR102119868B1 (ko) | 홍보용 미디어 콘텐츠 제작 시스템 및 그 방법 | |
CN109688463A (zh) | 一种剪辑视频生成方法、装置、终端设备及存储介质 | |
CN111243626A (zh) | 一种说话视频生成方法及系统 | |
JP2011215964A (ja) | サーバ装置、クライアント装置、コンテンツ推薦方法及びプログラム | |
CN114390217B (zh) | 视频合成方法、装置、计算机设备和存储介质 | |
CN105989067B (zh) | 从图片生成文本摘要的方法、用户设备及训练服务器 | |
US9525841B2 (en) | Imaging device for associating image data with shooting condition information | |
JP2015148701A (ja) | ロボット制御装置、ロボット制御方法及びロボット制御プログラム | |
TW202042172A (zh) | 智慧教學顧問生成方法、系統、設備及儲存介質 | |
JP2016177483A (ja) | コミュニケーション支援装置、コミュニケーション支援方法及びプログラム | |
KR20220017068A (ko) | 인공지능 콘텐츠 자동 생성 및 변형 방법 | |
CN117178271A (zh) | 从时刻内容项的自动记忆创建和检索 | |
KR101913811B1 (ko) | 얼굴 표현 및 심리 상태 파악과 보상을 위한 얼굴 정보 분석 방법 및 얼굴 정보 분석 장치 | |
Rastgoo et al. | All you need in sign language production | |
Shen et al. | Boosting consistency in story visualization with rich-contextual conditional diffusion models | |
KR101902553B1 (ko) | 스토리텔링 콘텐츠 툴 제공 단말기 및 스토리텔링 콘텐츠 제공 방법 | |
CN114928755B (zh) | 一种视频制作方法、电子设备及计算机可读存储介质 | |
CN111311713A (zh) | 漫画处理方法、显示方法、装置、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190829 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190829 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200330 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200814 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20200814 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20200825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200821 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200910 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200915 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6783479 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |