JP2020174339A - 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム - Google Patents
段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2020174339A JP2020174339A JP2019218381A JP2019218381A JP2020174339A JP 2020174339 A JP2020174339 A JP 2020174339A JP 2019218381 A JP2019218381 A JP 2019218381A JP 2019218381 A JP2019218381 A JP 2019218381A JP 2020174339 A JP2020174339 A JP 2020174339A
- Authority
- JP
- Japan
- Prior art keywords
- paragraph
- narration
- candidate material
- material resource
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/025—Systems for the transmission of digital non-picture data, e.g. of text during the active part of a television frame
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/265—Mixing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
Claims (18)
- ナレーションと、前記ナレーションに対応する、映像または画像からなる候補素材リソースのセットを取得するステップと、
前記ナレーションにおける各段落と、前記候補素材リソースのセットにおける各候補素材リソースとのマッチング度を取得するステップと、
前記ナレーションにおける各段落と前記各候補素材リソースとのマッチング度、前記各候補素材リソースの再生時間長、および前記ナレーションにおける各段落のテキスト長に基づいて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定するステップと、を含み、
画像の再生時間長が事前設定された画像再生時間長である、段落と映像を整列させるための方法。 - 前記方法は、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスに基づいて、前記ナレーションに対応する映像を生成するステップをさらに含む、請求項1に記載の方法。
- 前記方法は、端末装置が受信した映像を提示できるように、前記ナレーションに対応する映像を前記端末装置に送信するステップをさらに含む、請求項2に記載の方法。
- 前記の前記ナレーションにおける各段落と前記各候補素材リソースとのマッチング度、前記各候補素材リソースの再生時間長、および前記ナレーションにおける各段落のテキスト長に基づいて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定するステップは、
前記ナレーションにおける各段落について、第1の事前設定された最適化アルゴリズムを用いて、該段落に対応する候補素材リソースシーケンスの再生時間長が、該段落に対応する再生時間長に等しいことを制約条件とし、該段落に対応する候補素材リソースシーケンスと該段落とのマッチング度が最大となることを最適化目標とし、該段落に対応する候補素材リソースシーケンスを確定することを含む、請求項3に記載の方法。 - 前記の前記ナレーションにおける各段落と前記各候補素材リソースとのマッチング度、前記各候補素材リソースの再生時間長、および前記ナレーションにおける各段落のテキスト長に基づいて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定するステップは、
第2の事前設定された最適化アルゴリズムを用いて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスの再生時間長が、該段落に対応する再生時間長に等しいことを制約条件とし、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスと関連段落とのマッチング度の和が最大となることを最適化目標とし、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定することを含む、請求項3に記載の方法。 - 前記ナレーションにおける各段落に対応する候補素材リソースシーケンスにおける候補素材リソースが互いに異なる、請求項5に記載の方法。
- 前記第1の事前設定された最適化アルゴリズムは、動的計画アルゴリズムまたは最短経路最適化アルゴリズムである、請求項4に記載の方法。
- 前記第2の事前設定された最適化アルゴリズムは、動的計画アルゴリズムまたは最短経路最適化アルゴリズムである、請求項5に記載の方法。
- ナレーションと前記ナレーションに対応する、映像または画像からなる候補素材リソースのセットを取得するように構成された第1取得ユニットと、
前記ナレーションにおける各段落と、前記候補素材リソースのセットにおける各候補素材リソースとのマッチング度を取得するように構成された第2取得ユニットと、
前記ナレーションにおける各段落と前記各候補素材リソースとのマッチング度、前記各候補素材リソースの再生時間長、および前記ナレーションにおける各段落のテキスト長に基づいて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定するように構成された確定ユニットと、を含み、
画像の再生時間長が事前設定された画像再生時間長である、段落と映像を整列させるための装置。 - 前記装置は、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスに基づいて、前記ナレーションに対応する映像を生成するように構成された映像生成ユニットをさらに含む、請求項9に記載の装置。
- 前記装置は、端末装置が受信した映像を提示できるように、前記ナレーションに対応する映像を前記端末装置に送信するように構成された映像送信ユニットをさらに含む、請求項10に記載の装置。
- 前記確定ユニットはさらに、
前記ナレーションにおける各段落について、第1の事前設定された最適化アルゴリズムを用いて、該段落に対応する候補素材リソースシーケンスの再生時間長が、該段落に対応する再生時間長に等しいことを制約条件とし、該段落に対応する候補素材リソースシーケンスと該段落とのマッチング度が最大となることを最適化目標とし、該段落に対応する候補素材リソースシーケンスを確定するように構成されている、請求項11に記載の装置。 - 前記確定ユニットはさらに、
第2の事前設定された最適化アルゴリズムを用いて、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスの再生時間長が、該段落に対応する再生時間長に等しいことを制約条件とし、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスと関連段落とのマッチング度の和が最大となることを最適化目標とし、前記ナレーションにおける各段落に対応する候補素材リソースシーケンスを確定するように構成されている、請求項11に記載の装置。 - 前記ナレーションにおける各段落に対応する候補素材リソースシーケンスにおける候補素材リソースが互いに異なる、請求項13に記載の装置。
- 前記第1の事前設定された最適化アルゴリズムは、動的計画アルゴリズムまたは最短経路最適化アルゴリズムである、請求項12に記載の装置。
- 前記第2の事前設定された最適化アルゴリズムは、動的計画アルゴリズムまたは最短経路最適化アルゴリズムである、請求項13に記載の装置。
- 1つまたは複数のプロセッサと、1つまたは複数のプログラムが記憶されている記憶装置と、を含むサーバーであって、
前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜8のいずれか一項に記載の方法を実施させるサーバー。 - コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、
前記コンピュータプログラムが1つまたは複数のプロセッサによって実行されると、請求項1〜8のいずれか一項に記載の方法を実施するコンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910277787.9 | 2019-04-08 | ||
CN201910277787.9A CN111800671B (zh) | 2019-04-08 | 2019-04-08 | 用于对齐段落和视频的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020174339A true JP2020174339A (ja) | 2020-10-22 |
JP6971292B2 JP6971292B2 (ja) | 2021-11-24 |
Family
ID=72662633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019218381A Active JP6971292B2 (ja) | 2019-04-08 | 2019-12-02 | 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11758088B2 (ja) |
JP (1) | JP6971292B2 (ja) |
CN (1) | CN111800671B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112866776B (zh) * | 2020-12-29 | 2022-09-20 | 北京金堤科技有限公司 | 视频生成方法和装置 |
CN113127683A (zh) * | 2021-04-22 | 2021-07-16 | 北京百度网讯科技有限公司 | 内容推荐方法、装置、电子设备和介质 |
CN113517004B (zh) * | 2021-06-16 | 2023-02-28 | 深圳市中金岭南有色金属股份有限公司凡口铅锌矿 | 视频生成方法、装置、终端设备及介质 |
CN113436604B (zh) * | 2021-06-22 | 2022-11-29 | 北京百度网讯科技有限公司 | 播报内容的方法及装置、电子设备和存储介质 |
CN114222193B (zh) * | 2021-12-03 | 2024-01-05 | 北京影谱科技股份有限公司 | 一种视频字幕时间对齐模型训练方法及系统 |
CN114222196A (zh) * | 2022-01-04 | 2022-03-22 | 阿里巴巴新加坡控股有限公司 | 一种剧情解说短视频的生成方法、装置及电子设备 |
CN115243107B (zh) * | 2022-07-08 | 2023-11-21 | 华人运通(上海)云计算科技有限公司 | 短视频播放的方法、装置、系统、电子设备和介质 |
CN117156079B (zh) * | 2023-11-01 | 2024-01-23 | 北京美摄网络科技有限公司 | 视频处理方法、装置、电子设备和可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09237486A (ja) * | 1996-03-01 | 1997-09-09 | Nippon Steel Corp | 映像と文字との統合管理システム |
WO2002037841A1 (fr) * | 2000-11-02 | 2002-05-10 | Fujiyama Co., Ltd. | Systeme de repartition du contenu d'une image numerique, procede de reproduction et support d'enregistrement de son programme de reproduction |
JP2004326404A (ja) * | 2003-04-24 | 2004-11-18 | Nec Corp | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム |
JP2007274418A (ja) * | 2006-03-31 | 2007-10-18 | Nec Personal Products Co Ltd | コンテンツ再生方法及びその装置並びに総覧情報生成方法及びその装置 |
JP2008039845A (ja) * | 2006-08-01 | 2008-02-21 | Nippon Hoso Kyokai <Nhk> | 解説付加音声生成装置及び解説付加音声生成プログラム |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5689585A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Method for aligning a text image to a transcription of the image |
JP2002091466A (ja) * | 2000-09-12 | 2002-03-27 | Pioneer Electronic Corp | 音声認識装置 |
US7840033B2 (en) * | 2004-04-02 | 2010-11-23 | K-Nfb Reading Technology, Inc. | Text stitching from multiple images |
US7769772B2 (en) * | 2005-08-23 | 2010-08-03 | Ricoh Co., Ltd. | Mixed media reality brokerage network with layout-independent recognition |
US7912724B1 (en) * | 2007-01-18 | 2011-03-22 | Adobe Systems Incorporated | Audio comparison using phoneme matching |
US20110047163A1 (en) * | 2009-08-24 | 2011-02-24 | Google Inc. | Relevance-Based Image Selection |
US8645298B2 (en) * | 2010-10-26 | 2014-02-04 | Microsoft Corporation | Topic models |
TWI474200B (zh) * | 2012-10-17 | 2015-02-21 | Inst Information Industry | Scene clip playback system, method and recording medium thereof |
US9471559B2 (en) * | 2012-12-10 | 2016-10-18 | International Business Machines Corporation | Deep analysis of natural language questions for question answering system |
GB2529564A (en) * | 2013-03-11 | 2016-02-24 | Video Dubber Ltd | Method, apparatus and system for regenerating voice intonation in automatically dubbed videos |
JP6317772B2 (ja) * | 2013-03-15 | 2018-04-25 | トランスレート アブロード,インコーポレイテッド | 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法 |
US9183466B2 (en) * | 2013-06-15 | 2015-11-10 | Purdue Research Foundation | Correlating videos and sentences |
US9545172B2 (en) | 2014-02-11 | 2017-01-17 | Adco Industries-Technologies, L.P. | Roller grill |
US10129608B2 (en) * | 2015-02-24 | 2018-11-13 | Zepp Labs, Inc. | Detect sports video highlights based on voice recognition |
US20160350653A1 (en) * | 2015-06-01 | 2016-12-01 | Salesforce.Com, Inc. | Dynamic Memory Network |
US10467268B2 (en) * | 2015-06-02 | 2019-11-05 | International Business Machines Corporation | Utilizing word embeddings for term matching in question answering systems |
US10074363B2 (en) * | 2015-11-11 | 2018-09-11 | Apptek, Inc. | Method and apparatus for keyword speech recognition |
WO2017158800A1 (ja) * | 2016-03-17 | 2017-09-21 | 株式会社Pfu | モバイル端末、画像処理方法、および、プログラム |
CN107241622A (zh) * | 2016-03-29 | 2017-10-10 | 北京三星通信技术研究有限公司 | 视频定位处理方法、终端设备及云端服务器 |
US20180082607A1 (en) * | 2016-09-19 | 2018-03-22 | Michael Everding | Interactive Video Captioning Program |
US10936969B2 (en) * | 2016-09-26 | 2021-03-02 | Shabaz Basheer Patel | Method and system for an end-to-end artificial intelligence workflow |
US10362349B1 (en) * | 2016-12-13 | 2019-07-23 | Google Llc | Detecting channel similarity based on content reuse |
CN107463698B (zh) * | 2017-08-15 | 2020-11-20 | 北京百度网讯科技有限公司 | 基于人工智能推送信息的方法和装置 |
US10846573B2 (en) * | 2018-07-31 | 2020-11-24 | Triangle Digital Ventures Ii, Llc | Detecting, redacting, and scoring confidential information in images |
-
2019
- 2019-04-08 CN CN201910277787.9A patent/CN111800671B/zh active Active
- 2019-12-02 JP JP2019218381A patent/JP6971292B2/ja active Active
- 2019-12-04 US US16/703,075 patent/US11758088B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09237486A (ja) * | 1996-03-01 | 1997-09-09 | Nippon Steel Corp | 映像と文字との統合管理システム |
WO2002037841A1 (fr) * | 2000-11-02 | 2002-05-10 | Fujiyama Co., Ltd. | Systeme de repartition du contenu d'une image numerique, procede de reproduction et support d'enregistrement de son programme de reproduction |
JP2004326404A (ja) * | 2003-04-24 | 2004-11-18 | Nec Corp | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム |
JP2007274418A (ja) * | 2006-03-31 | 2007-10-18 | Nec Personal Products Co Ltd | コンテンツ再生方法及びその装置並びに総覧情報生成方法及びその装置 |
JP2008039845A (ja) * | 2006-08-01 | 2008-02-21 | Nippon Hoso Kyokai <Nhk> | 解説付加音声生成装置及び解説付加音声生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US11758088B2 (en) | 2023-09-12 |
CN111800671B (zh) | 2022-08-12 |
JP6971292B2 (ja) | 2021-11-24 |
US20200322570A1 (en) | 2020-10-08 |
CN111800671A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6971292B2 (ja) | 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム | |
WO2020253806A1 (zh) | 展示视频的生成方法、装置、设备及存储介质 | |
JP7104683B2 (ja) | 情報を生成する方法および装置 | |
US20200234478A1 (en) | Method and Apparatus for Processing Information | |
US9697871B2 (en) | Synchronizing recorded audio content and companion content | |
JP6967059B2 (ja) | 映像を生成するための方法、装置、サーバ、コンピュータ可読記憶媒体およびコンピュータプログラム | |
CN111599343B (zh) | 用于生成音频的方法、装置、设备和介质 | |
CN109474843A (zh) | 语音操控终端的方法、客户端、服务器 | |
JP2020008854A (ja) | 音声要求を処理するための方法および装置 | |
CN110534085B (zh) | 用于生成信息的方法和装置 | |
WO2022037419A1 (zh) | 音频内容识别方法、装置、设备和计算机可读介质 | |
WO2021057740A1 (zh) | 视频生成方法、装置、电子设备和计算机可读介质 | |
CN110717337A (zh) | 信息处理方法、装置、计算设备和存储介质 | |
US20220385996A1 (en) | Method for generating target video, apparatus, server, and medium | |
US20240147023A1 (en) | Video generation method and apparatus, and device, medium and product | |
JP7050857B2 (ja) | 要約生成方法及び装置 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN115967833A (zh) | 视频生成方法、装置、设备计存储介质 | |
CN112383721B (zh) | 用于生成视频的方法、装置、设备和介质 | |
WO2023174073A1 (zh) | 视频生成方法、装置、设备、存储介质和程序产品 | |
CN111862933A (zh) | 用于生成合成语音的方法、装置、设备和介质 | |
CN113823282A (zh) | 语音处理方法、系统和装置 | |
JP7113000B2 (ja) | 映像を生成するための方法および装置 | |
WO2021170094A1 (zh) | 用于信息交互的方法和装置 | |
CN112287173A (zh) | 用于生成信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6971292 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |