JP2020173776A - 映像を生成するための方法および装置 - Google Patents
映像を生成するための方法および装置 Download PDFInfo
- Publication number
- JP2020173776A JP2020173776A JP2019219315A JP2019219315A JP2020173776A JP 2020173776 A JP2020173776 A JP 2020173776A JP 2019219315 A JP2019219315 A JP 2019219315A JP 2019219315 A JP2019219315 A JP 2019219315A JP 2020173776 A JP2020173776 A JP 2020173776A
- Authority
- JP
- Japan
- Prior art keywords
- video
- query
- material resource
- text
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/732—Query formulation
- G06F16/7343—Query language or query format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/002—Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/87—Regeneration of colour television signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
Abstract
Description
Claims (16)
- ユーザによって入力されたクエリテキストを受信するステップと、
前記クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップと、
前記素材リソースのセットを提示するステップと、
提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップと、
前記素材リソースシーケンスに基づいて映像を生成するステップと、を含む、映像を生成するための方法。 - 前記クエリテキストに関連する素材リソースのセットをクエリするステップは、
前記クエリテキストを単語分割して、前記クエリテキストに対応する分割単語シーケンスを取得することと、
前記分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることと、
見つけられた素材リソースを素材リソースのセットとして確定することと、を含む、請求項1に記載の方法。 - 該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることは、
対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリすることを含む、請求項2に記載の方法。 - 前記クエリテキストに関連する素材リソースのセットをクエリするステップは、
対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリすることと、
見つけられた素材リソースを前記素材リソースのセットとして確定することと、を含む、請求項1に記載の方法。 - 前記素材リソースシーケンスに基づいて映像を生成するステップは、
前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を、第1の映像として確定することと、
前記素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を、第1の音声として確定することと、
前記第1の映像と前記第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定することと、を含む、請求項1に記載の方法。 - 前記素材リソースシーケンスに基づいて映像を生成するステップは、
対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリすることと、
得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定することと、
音声合成技術により前記テキストクエリ結果の要約に対応する音声を第2の音声として生成することと、
前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得することと、
前記第2の音声と前記第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定することと、を含む、請求項1に記載の方法。 - 前記方法は、
生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生することをさらに含む、請求項1に記載の方法。 - ユーザによって入力されたクエリテキストを受信するように構成された受信ユニットと、
前記クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするように構成されたクエリユニットと、
前記素材リソースのセットを提示するように構成された提示ユニットと、
提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するように構成された確定ユニットと、
前記素材リソースシーケンスに基づいて映像を生成するように構成された生成ユニットと、を含む、映像を生成するための装置。 - 前記クエリユニットは、
前記クエリテキストを単語分割し、前記クエリテキストに対応する分割単語シーケンスを取得するように構成された単語分割モジュールと、
前記分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリするように構成された第1のクエリモジュールと、
見つけられた素材リソースを素材リソースのセットとして確定するように構成された第1の確定モジュールと、を含む、請求項8に記載の装置。 - 前記第1のクエリモジュールはさらに、
対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリするように構成されている、請求項9に記載の装置。 - 前記クエリユニットは、
対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリするように構成された第2のクエリモジュールと、
見つけられた素材リソースを前記素材リソースのセットとして確定するように構成された第2の確定モジュールと、を含む、請求項8に記載の装置。 - 前記生成ユニットは、
前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を第1の映像として確定するように構成された第3の確定モジュールと、
前記素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を第1の音声として確定するように構成された第4の確定モジュールと、
前記第1の映像と前記第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定するように構成された第5の確定モジュールとを含む、請求項8に記載の装置。 - 前記生成ユニットは、
対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリするように構成された第3のクエリモジュールと、
得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定するように構成された第6の確定モジュールと、
音声合成技術により前記テキストクエリ結果の要約に対応する音声を第2の音声として生成するように構成された音声合成モジュールと、
前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得するように構成された接続モジュールと、
前記第2の音声と前記第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定するように構成された第7の確定モジュールと、を含む、請求項8に記載の装置。 - 前記装置は、
生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生するように構成された再生ユニットをさらに含む、請求項8に記載の装置。 - 1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を含むサーバであって、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜7のいずれか1項に記載の方法を実施させるサーバ。 - コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、
前記コンピュータプログラムは、1つまたは複数のプロセッサによって実行されると、請求項1〜7のいずれか1項に記載の方法を実施する、コンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910277152.9 | 2019-04-08 | ||
CN201910277152.9A CN111866609B (zh) | 2019-04-08 | 2019-04-08 | 用于生成视频的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173776A true JP2020173776A (ja) | 2020-10-22 |
JP7113000B2 JP7113000B2 (ja) | 2022-08-04 |
Family
ID=72663186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019219315A Active JP7113000B2 (ja) | 2019-04-08 | 2019-12-04 | 映像を生成するための方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10910014B2 (ja) |
JP (1) | JP7113000B2 (ja) |
CN (1) | CN111866609B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287168A (zh) * | 2020-10-30 | 2021-01-29 | 北京有竹居网络技术有限公司 | 用于生成视频的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172133A (ja) * | 2004-12-15 | 2006-06-29 | Canon Inc | 情報処理システム、情報処理装置、情報処理方法、プログラム及び記憶媒体 |
JP2014207527A (ja) * | 2013-04-11 | 2014-10-30 | キヤノン株式会社 | 映像生成装置及びその制御方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398832A (zh) * | 2007-09-30 | 2009-04-01 | 国际商业机器公司 | 利用人脸检测的图像搜索方法和系统 |
US20100211605A1 (en) * | 2009-02-17 | 2010-08-19 | Subhankar Ray | Apparatus and method for unified web-search, selective broadcasting, natural language processing utilities, analysis, synthesis, and other applications for text, images, audios and videos, initiated by one or more interactions from users |
US20120177345A1 (en) * | 2011-01-09 | 2012-07-12 | Matthew Joe Trainer | Automated Video Creation Techniques |
US9443011B2 (en) * | 2011-05-18 | 2016-09-13 | Microsoft Technology Licensing, Llc | Searching for images by video |
CN103838866B (zh) * | 2014-03-20 | 2017-04-05 | 广东小天才科技有限公司 | 一种文本转换方法及装置 |
CN103928039B (zh) * | 2014-04-15 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 一种视频合成方法及装置 |
CN104036010B (zh) * | 2014-06-25 | 2017-05-24 | 华东师范大学 | 一种基于半监督cbow的用户搜索词主题分类的方法 |
US20170104840A1 (en) * | 2015-10-08 | 2017-04-13 | Perry M. Spagnola | Adaptive system cache |
CN105893427A (zh) * | 2015-12-07 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 资源搜索方法以及服务器 |
CN108416028B (zh) * | 2018-03-09 | 2021-09-21 | 北京百度网讯科技有限公司 | 一种搜索内容资源的方法、装置及服务器 |
CN109036425B (zh) * | 2018-09-10 | 2019-12-24 | 百度在线网络技术(北京)有限公司 | 用于操作智能终端的方法和装置 |
-
2019
- 2019-04-08 CN CN201910277152.9A patent/CN111866609B/zh active Active
- 2019-12-04 JP JP2019219315A patent/JP7113000B2/ja active Active
- 2019-12-04 US US16/703,717 patent/US10910014B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006172133A (ja) * | 2004-12-15 | 2006-06-29 | Canon Inc | 情報処理システム、情報処理装置、情報処理方法、プログラム及び記憶媒体 |
JP2014207527A (ja) * | 2013-04-11 | 2014-10-30 | キヤノン株式会社 | 映像生成装置及びその制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200321026A1 (en) | 2020-10-08 |
JP7113000B2 (ja) | 2022-08-04 |
US10910014B2 (en) | 2021-02-02 |
CN111866609B (zh) | 2022-12-13 |
CN111866609A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200241719A1 (en) | System and method for visual analysis of on-image gestures | |
JP6967059B2 (ja) | 映像を生成するための方法、装置、サーバ、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN109168026B (zh) | 即时视频显示方法、装置、终端设备及存储介质 | |
CN107193792B (zh) | 基于人工智能的生成文章的方法和装置 | |
JP6971292B2 (ja) | 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN111866610B (zh) | 用于生成信息的方法和装置 | |
JP6681450B2 (ja) | 情報処理方法および装置 | |
JP2020008854A (ja) | 音声要求を処理するための方法および装置 | |
CN109474843A (zh) | 语音操控终端的方法、客户端、服务器 | |
CN109582825B (zh) | 用于生成信息的方法和装置 | |
CN110717337A (zh) | 信息处理方法、装置、计算设备和存储介质 | |
CN111666416B (zh) | 用于生成语义匹配模型的方法和装置 | |
US10600337B2 (en) | Intelligent content parsing with synthetic speech and tangible braille production | |
CN115982376B (zh) | 基于文本、多模数据和知识训练模型的方法和装置 | |
CN110929094A (zh) | 一种视频标题处理方法和装置 | |
CN111883131B (zh) | 语音数据的处理方法及装置 | |
CN111970536B (zh) | 一种基于音频生成视频的方法和装置 | |
WO2023016349A1 (zh) | 一种文本输入方法、装置、电子设备和存储介质 | |
CN112287168A (zh) | 用于生成视频的方法和装置 | |
CN115357755B (zh) | 视频生成方法、视频展示方法和装置 | |
CN112069950B (zh) | 提取热词的方法、系统、电子设备及介质 | |
CN112182255A (zh) | 用于存储媒体文件和用于检索媒体文件的方法和装置 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
JP7113000B2 (ja) | 映像を生成するための方法および装置 | |
CN113282770A (zh) | 一种多媒体推荐系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7113000 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |