JP2020173776A - 映像を生成するための方法および装置 - Google Patents

映像を生成するための方法および装置 Download PDF

Info

Publication number
JP2020173776A
JP2020173776A JP2019219315A JP2019219315A JP2020173776A JP 2020173776 A JP2020173776 A JP 2020173776A JP 2019219315 A JP2019219315 A JP 2019219315A JP 2019219315 A JP2019219315 A JP 2019219315A JP 2020173776 A JP2020173776 A JP 2020173776A
Authority
JP
Japan
Prior art keywords
video
query
material resource
text
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019219315A
Other languages
English (en)
Other versions
JP7113000B2 (ja
Inventor
ハオ ティエン,
Hao Tian
ハオ ティエン,
ダーミン ルー,
Daming Lu
ダーミン ルー,
シー チェン,
Xi Chen
シー チェン,
ジェフ チェンユー ワン,
Chienyu Wang Jeff
ジェフ チェンユー ワン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu com Times Technology Beijing Co Ltd
Baidu USA LLC
Original Assignee
Baidu com Times Technology Beijing Co Ltd
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu com Times Technology Beijing Co Ltd, Baidu USA LLC filed Critical Baidu com Times Technology Beijing Co Ltd
Publication of JP2020173776A publication Critical patent/JP2020173776A/ja
Application granted granted Critical
Publication of JP7113000B2 publication Critical patent/JP7113000B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7343Query language or query format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/002Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/87Regeneration of colour television signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Abstract

【課題】ユーザによる映像生成のコストを削減して映像を生成するための方法、装置、サーバ及びコンピュータ可読記憶媒体を提供する。【解決手段】方法は、ユーザによって入力されたクエリテキストを受信するステップ201と、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップ202と、素材リソースのセットを提示するステップ203と、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップ204と、素材リソースシーケンスに基づいて映像を生成するステップ205と、を含む。【選択図】図2A

Description

本出願の実施形態は、コンピュータ技術分野に関し、特に映像を生成するための方法および装置に関する。
現在、ユーザは映像を作成する過程において、映像を生成するために必要な様々な素材リソース(映像、音声、画像、キャプションテキストを含む)を手動で撮影または作成する必要がある。
本出願の実施形態は、映像を生成するための方法および装置を提案する。
第1の態様では、本開示の実施例は、ユーザによって入力されたクエリテキストを受信するステップと、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップと、素材リソースのセットを提示するステップと、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップと、素材リソースシーケンスに基づいて映像を生成するステップと、を含む、映像を生成するための方法を提供する。
いくつかの実施例において、クエリテキストに関連する素材リソースのセットをクエリするステップは、クエリテキストを単語分割して、クエリテキストに対応する分割単語シーケンスを取得することと、分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることと、見つけられた素材リソースを素材リソースのセットとして確定することと、を含む。
いくつかの実施例において、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることは、対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリすることを含む。
いくつかの実施例において、クエリテキストに関連する素材リソースのセットをクエリするステップは、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリすることと、見つけられた素材リソースを素材リソースのセットとして確定することと、を含む。
いくつかの実施例において、素材リソースシーケンスに基づいて映像を生成するステップは、素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を、第1の映像として確定することと、素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を、第1の音声として確定することと、第1の映像と第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定することと、を含む。
いくつかの実施例において、素材リソースシーケンスに基づいて映像を生成するステップは、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリすることと、得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定することと、音声合成技術によりテキストクエリ結果の要約に対応する音声を第2の音声として生成することと、素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得することと、第2の音声と第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定することと、を含む。
いくつかの実施例において、該方法は、生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生することをさらに含む。
第2の態様では、本開示の実施例は、ユーザによって入力されたクエリテキストを受信するように構成された受信ユニットと、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするように構成されたクエリユニットと、素材リソースのセットを提示するように構成された提示ユニットと、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するように構成された確定ユニットと、素材リソースシーケンスに基づいて映像を生成するように構成された生成ユニットと、を含む、映像を生成するための装置を提供する。
いくつかの実施例において、クエリユニットは、クエリテキストを単語分割し、クエリテキストに対応する分割単語シーケンスを取得するように構成された単語分割モジュールと、分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリするように構成された第1のクエリモジュールと、見つけられた素材リソースを素材リソースのセットとして確定するように構成された第1の確定モジュールと、を含む。
いくつかの実施例において、第1のクエリモジュールはさらに、対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリするように構成されている。
いくつかの実施例において、クエリユニットは、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリするように構成された第2のクエリモジュールと、見つけられた素材リソースを素材リソースのセットとして確定するように構成された第2の確定モジュールと、を含む。
いくつかの実施例において、生成ユニットは、素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を第1の映像として確定するように構成された第3の確定モジュールと、素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を第1の音声として確定するように構成された第4の確定モジュールと、前記第1の映像と前記第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定するように構成された第5の確定モジュールとを含む。いくつかの実施例において、生成ユニットは、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリするように構成された第3のクエリモジュールと、得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定するように構成された第6の確定モジュールと、音声合成技術により前記テキストクエリ結果の要約に対応する音声を第2の音声として生成するように構成された音声合成モジュールと、素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得するように構成された接続モジュールと、第2の音声と前記第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定するように構成された第7の確定モジュールと、を含む。
いくつかの実施例において、該装置は、生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生するように構成された再生ユニットをさらに含む。
第3の態様では、本開示の実施例は、1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を含むサーバであって、前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに第1の態様のいずれか一つの実施形態に記載の方法を実施させるサーバを提供する。
第4の態様では、本開示の実施例は、コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムは、1つまたは複数のプロセッサによって実行されると、第1の態様のいずれか一つの実施形態に記載の方法を実施する、コンピュータ可読記憶媒体を提供する。
第5の態様では、本開示の実施例は、他のサーバであって、インターフェースと、1つまたは複数のプログラムが格納されているメモリと、前記インターフェースおよび前記メモリに動作可能に接続されている1つまたは複数のプロセッサとを備え、前記プロセッサは、ユーザによって入力されたクエリテキストを受信するステップと、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップと、素材リソースのセットを提示するステップと、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップと、素材リソースシーケンスに基づいて映像を生成するステップの実行に用いられる、サーバを提供する。
第5の態様では、本開示の実施例は、コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、前記コンピュータプログラムが1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサは、ユーザによって入力されたクエリテキストを受信するステップと、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップと、素材リソースのセットを提示するステップと、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップと、素材リソースシーケンスに基づいて映像を生成するステップを行う、コンピュータ可読記憶媒体を提供する。
現在、ユーザは映像を作成する過程において、映像を生成するために必要な様々な素材リソース(映像、音声、画像を含む)を手動で撮影したり、作成したりする必要がある。したがって、映像を作成するコスト(ハードウェアコスト、作成経験コスト、時間コストなどを含む)は高い。本開示の実施形態によって提供される映像を生成するための方法および装置は、まず、ユーザによって入力されたクエリテキストを受信し、そして、クエリテキストに関連する、画像、映像、または音声である素材リソースのセットをクエリし、その後、素材リソースのセットを提示し、次いで、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信して、素材リソースシーケンスを確定し、最後に、素材リソースシーケンスに基づいて映像を生成することにより、ユーザによって入力されたクエリテキストに基づいて素材リソースをユーザに提供し、提供された素材リソースに対するユーザの選択操作とソート操作に基づいて映像を生成することで、ユーザによる映像生成のコストを削減できる。
本出願の他の特徴、目的および利点は、添付図面を参照して非限定的な実施形態について行った詳細な説明から、より明らかになるであろう。
図1は、本出願の一実施形態を適用できる例示的なシステムアーキテクチャを示す図である。 図2Aは、本出願に係る映像を生成するための方法の一実施形態を示すフローチャートである。 図2Bは、本出願に係るステップ202の一実施形態を示す分解フローチャートである。 図2Cは、本出願に係るステップ202の別の実施形態を示す分解フローチャートである。 図2Dは、本出願に係るステップ205の一実施形態を示す分解フローチャートである。 図2Eは、本出願に係るステップ205の別の実施形態を示す分解フローチャートである。 図3は、本出願に係る素材リソースに対応する意味ベクトルを確定する一実施形態を示すフローチャートである。 図4は、本出願に係る映像を生成するための方法の適用シナリオを示す概略図である。 図5は、本出願に係る映像を生成するための方法の別の実施形態を示すフローチャートである。 図6は、本出願に係る映像を生成するための装置の一実施形態を示す概略構成図である。 図7は、本出願の一実施形態に係るサーバの実施に適するコンピュータシステムの概略構造図である。
本出願は、添付の図面および実施形態を参照して、以下でさらに詳細に説明される。本明細書に記載される特定の実施形態は、本発明を限定するものではなく、本発明の単なる例示であることを理解されたい。また、説明の便宜上、関連する発明に関連する部分のみが図面に示されていることにも留意されたい。
矛盾しない前提では、本出願の実施形態および実施形態における特徴は相互に組み合わせることができる。以下、添付図面を参照しつつ実施形態を踏まえて、本出願を詳しく説明する。
図1は、本出願に係る映像を生成するための方法または映像を生成するための装置の実施形態を適用できる例示的なシステムアーキテクチャ100を示している。
図1に示されるように、システムアーキテクチャ100は、端末装置101、102、103と、ネットワーク104と、サーバ105と、を含み得る。ネットワーク104は、端末装置101、102、103とサーバ105との間の通信リンクのための媒体を提供する。ネットワーク104は、有線、無線通信リンクまたは光ファイバケーブルなどの様々なタイプの接続を含み得る。
ユーザは、端末装置101、102、103を使用して、メッセージ等を受信または送信するために、ネットワーク104を介してサーバ105と対話することができる。映像生成系アプリケーション、ウェブブラウザアプリケーション、ショッピング系アプリケーション、検索系アプリケーション、インスタント通信ツール、メールクライアント、ソーシャルプラットフォームソフトウェアなど、様々な通信クライアントアプリケーションを、端末装置101、102、103にインストールすることができる。
端末装置101、102、103は、ハードウェアであってもソフトウェアであってもよいことに留意されたい。端末装置101、102、103がハードウェアである場合、スマートフォン、タブレットコンピュータ、電子書籍リーダー、MP3プレーヤー(Moving Picture Experts Group Audio Layer III)、MP4(Moving Picture Experts Group Audio Layer IV)プレーヤー、ラップトップポータブルコンピュータ、デスクトップコンピュータなどを含むがこれらに限定されない、表示画面を有する様々な電子機器であり得る。端末装置101、102、103がソフトウェアである場合、上記の電子機器にインストールされてもよい。また、複数のソフトウェアもしくはソフトウェアモジュールとして実施されることも、または単一のソフトウェアもしくはソフトウェアモジュールとして実施されることも可能である。ここでは特に限定しない。
サーバ105は、端末装置101、102、103に表示される映像生成系アプリケーションをサポートするバックエンドサーバなど、様々なサービスを提供するサーバであり得る。バックグラウンドサーバは、受信したクエリテキストを含む映像生成系リクエストなどのデータについて分析などの処理を行い、処理結果(例えば、素材リソースのセット)を端末装置にフィードバックすることができる。
なお、サーバ105はハードウェアであってもソフトウェアであってもよい。サーバ105がハードウェアである場合、複数のサーバからなる分散サーバクラスタとして実施されることも、単一のサーバとして実施されることも可能である。サーバ105がソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール(例えば、映像生成サービスを提供するため)として実施されることも、単一のソフトウェアまたはソフトウェアモジュールとして実施されることも可能である。ここでは特に限定しない。
なお、本出願に係る実施形態によって提供される映像を生成するための方法は、一般にサーバ105によって実行されるため、映像を生成するための装置は、一般にサーバ105に設置される。
なお、サーバ105は、ユーザが入力したクエリテキストをローカルに受信し、最終的に映像を生成することも可能である。この場合、例示的なシステムアーキテクチャ100は、端末装置101、102、103およびネットワーク104を含まなくてもよい。
なお、端末装置101、102、103において、クエリテキストに関連する素材リソースのセットをローカルにクエリすることも可能である。この場合、映像を生成するための方法は、端末装置101、102、103によって実行されてもよいため、それに応じて、映像を生成するための装置は、端末装置101、102、103に設置されてもよい。この場合、例示的なシステムアーキテクチャ100は、サーバ105とネットワーク104とを含まなくてもよい。
なお、本出願に係る実施形態によって提供される映像を生成するための方法は、サーバ105によって実行されてもよいため、映像を生成するための装置は、サーバ105に設置されてもよい。この場合、例示的なシステムアーキテクチャ100は、端末装置101、102、103およびネットワーク104を含まなくてもよい。本出願に係る実施形態によって提供される映像を生成するための方法は、端末装置101、102、103によって実行されてもよいため、映像を生成するための装置は、端末装置101、102、103に設置されてもよい。この場合、例示的なシステムアーキテクチャ100は、サーバ105とネットワーク104とを含まなくてもよい。本出願に係る実施形態によって提供される映像を生成するための方法は、サーバ105と端末装置101、102、103とによって実行されてもよい。例えば、「クエリテキストに関連する素材リソースのセットをクエリする」というステップがサーバ105によって実行され、その他のステップが端末装置101、102、103によって実行されてもよい。本出願では、これについて特に限定しない。
図1の端末装置、ネットワーク、およびサーバの数は単なる例示であることを理解されたい。実施の必要に応じて、任意の数の端末装置、ネットワーク、およびサーバが存在する可能性がある。
図2Aを参照すると、本出願に係る映像を生成するための方法の一実施形態のフローチャート200が示されている。該映像を生成するための方法は、次のステップ(ステップ201〜205)を含む。
ステップ201:ユーザによって入力されたクエリテキストを受信する。
本実施形態のいくつかのオプションの実施方法では、映像を生成するための方法の実行主体(例えば、図1に示されるサーバまたは端末装置)は、ユーザによって入力されたクエリテキストをローカルに受信することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、上記の実行主体のネットワークに接続された端末装置から、ユーザによって入力されたクエリテキストを遠隔的に受信することもできる。
ステップ202:クエリテキストに関連する素材リソースのセットをクエリする。
本実施形態では、上記の実行主体は、ステップ201で受信したクエリテキストに関連する素材リソースのセットを様々な実施方法でクエリすることができる。ここで、素材リソースは、画像、映像、または音声であり得る。
本実施形態のいくつかのオプションの実施方法では、ステップ202は次のように行うことができる。
ウェブクローラーを利用して、複数のサイトでクエリテキストに関連するページをキャプチャし、キャプチャしたページにおける画像、映像、音声を見つけられた素材リソースのセットとして確定する。
本実施形態のいくつかのオプションの実施方法では、ステップ202は、図2Bに示されるステップ2021〜2023を含むこともできる。図2Bを参照すると、本出願に係るステップ202の一実施形態の分解フローチャートが示されている。
ステップ2021:クエリテキストを単語分割し、クエリテキストに対応する分割単語シーケンスを取得する。
ここで、様々な実施方法でクエリテキストを単語分割し、クエリテキストに対応する分割単語シーケンスを取得することができる。ここで、分割単語シーケンスは、順番に並べられた少なくとも1つの分割単語からなる。
なお、テキストをどのように単語分割するかは、現在広く研究され応用されている公知技術であるため、ここでは、その説明を省略する。例えば、辞書に基づく単語分割アルゴリズム、統計に基づく単語分割アルゴリズム、または規則に基づく単語分割アルゴリズムなどを用いることができる。
ステップ2022:分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリする。
いくつかの実施方法では、ステップ2021で取得された分割単語シーケンスにおける各分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることができる。
いくつかの実施方法では、ステップ2021で取得された分割単語シーケンスにおける一部の分割単語について、一部の分割単語における各分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることができる。例えば、分割単語シーケンスにおける各非機能語分割単語について、該非機能語分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることができる。
ここで、素材リソースは、画像、映像、または音声であり得るため、テキストと画像とのマッチング度を計算する様々な方法を用いて、テキストと画像タイプの素材リソースとのマッチング度を計算することができ、また、テキストと映像とのマッチング度を計算するための様々な方法を用いて、テキストと映像タイプの素材リソースとのマッチング度を計算することができ、さらに、テキストと音声とのマッチング度を計算するための様々な方法を用いて、テキストと音声タイプの素材リソースとのマッチング度を計算することもできる。本出願では、これについて特に限定しない。
いくつかの実施方法では、分割単語の単語ベクトルと素材リソースの意味ベクトルとの類似度を、分割単語と素材リソースとのマッチング度として確定することができる。ステップ2022は、次のように行うことができる。分割単語シーケンスにおける分割単語について、対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリする。ここで、ベクトルとベクトルとの類似度を計算する様々な方法を用いて、分割単語の単語ベクトルと素材リソースの意味ベクトルとの類似度を計算することができる。例えば、ベクトル間のユークリッド距離、マンハッタン距離、チェビシェフ距離、ミンコフスキー距離、正規化ユークリッド距離、馬氏距離、余弦類似度、ハミング距離、ジェカド距離、ジェカド類似係数、相関係数、相関距離、エントロピーなどを計算することにより、ベクトル間の類似度を確定することができる。
ここで、様々な実施方法で分割単語の単語ベクトルを確定することができる。すなわち、計算しやすくするために、分割単語をベクトル形式で表現することが考えられる。
例えば、バッグオブワーズモデルを用いて分割単語の単語ベクトルを生成することができる。具体的には、Vをバッグオブワーズモデルにおける辞書に含まれる単語の数とすると、分割単語wについて、wに含まれる辞書における1番目の単語〜V番目の単語の数をそれぞれx〜xとする。そうすると、分割単語wに対応するベクトルは{x、x、…、x}となる。
また、例えば、予め定められた単語ベクトルテーブルから分割単語の単語ベクトルをクエリすることもできる。該単語ベクトルテーブルは、単語と単語の単語ベクトルとの対応関係を表す。単語ベクトルテーブルは、予めトレーニングして取得されたものであり得る。例えば、統計に基づく方法または言語モデルに基づく方法でトレーニングすることにより、単語ベクトルテーブルを取得することができる。
例えば、統計に基づく方法は、共起行列法であり得る。該共起行列法では、予め指定された大きさのウィンドウにおける単語の共起回数を集計することにより、単語の周辺の共起語の回数を現在の単語の単語ベクトルとする。具体的には、大量のコーパステキストから共起行列を構築することにより、該コーパステキスト中に出現する単語における各単語に対応する単語ベクトルを定義し、単語ベクトルテーブルを取得することができる。
また、例えば、統計に基づく方法は、特異値分解法であり得る。共起行列法には高次元と希薄性の問題があるため、特異値分解法では、共起行列法で取得された行列に対して特異値分解を行い、行列直交行列を取得し、そして、直交行列を正規化して行列を取得し、該コーパステキスト中に出現する単語における各単語に対応する単語ベクトルを定義し、単語ベクトルテーブルを取得する。
言語モデルに基づいて単語ベクトルテーブルを生成することは、ニューラルネットワークの言語モデル(NNLM,Neural Network Language Model)をトレーニングすることにより、言語モデルの付随的な産出としての単語ベクトルテーブルを生成することである。NNLMの背後にある基本的な構想は、文脈環境に出現する単語を予測することである。かかる文脈環境の予測は本質的に共起統計特徴への学習でもある。例えば、NNLMを用いて単語ベクトルを生成する方法は、Skip−gram、CBOW、LBL、NNLM、C&W、GloVe、BERT(Bidirectional Encoder Representations from Transformers、双方向エンコーダ)、GPT−2などの様々な方法を含むことができるが、これらに限定されない。
いくつかの実施方法では、素材リソースに対応する意味ベクトルを確定することは、図3に示されるステップ301〜308を含むことができる。図3を参照すると、本出願に係る素材リソースに対応する意味ベクトルを確定する一実施形態の分解フローチャートが示されている。
ステップ301:該素材リソースが画像、映像、または音声であるかを確定する。
該素材リソースが画像であると確定された場合、ステップ302に進む。
該素材リソースが映像であると確定された場合、ステップ304に進む。
該素材リソースが音声であると確定された場合、ステップ307に進む。
ステップ302:該画像素材リソースを意味分割し、該画像素材リソースに対応する少なくとも1つの意味アノテーション結果を取得する。
ここで、ステップ301において該素材リソースが画像であると確定された場合、様々な実施方法で、該画像素材リソースを意味分割し、該画像素材リソースに対応する少なくとも1つの意味アノテーション結果を取得することができる。それぞれの意味アノテーション結果は、1つの単語またはフレーズであり得る。例えば、該画像素材リソースは、ライオンが草原でカモシカを追いかけていることを表す画像である場合、該画像を意味分割して得られる少なくとも1つの意味アノテーション結果は、{「ライオン」,「草原」,「カモシカ」}であり得る。
なお、画像をどのように意味分割するかは、現在広く研究され応用されている公知技術であるため、ここではその説明を省略する。
ステップ303:取得された少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する意味ベクトルに基づいて、該素材リソースに対応する意味ベクトルを確定する。
ステップ302では、少なくとも1つの意味アノテーション結果が取得されているため、ここでは、まず、ステップ302で取得された少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する単語ベクトルを確定することができる。そして、少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する単語ベクトルに基づいて、該素材リソースに対応する意味ベクトルを確定することができる。例えば、少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する単語ベクトルの平均値ベクトルまたは中央値ベクトルを、該素材リソースに対応する意味ベクトルとして確定することができる。また、少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する単語ベクトルのうち、モジュールが最大またはモジュールが最小の単語ベクトルを、該素材リソースに対応する意味ベクトルとして確定することもできる。
ここで、各意味アノテーション結果に対応する単語ベクトルを確定する方法は、ステップ2022での関連説明を参照することができる。
ステップ303を経て、画像素材リソースに対応する意味ベクトルが確定された。
ステップ304:該映像素材リソースをダウンサンプリングし、少なくとも1つのサンプル画像を取得する。
ここで、ステップ301において該素材リソースが映像であると確定された場合、様々な実施方法で、該映像素材リソースをダウンサンプリングし、少なくとも1つのサンプル画像を取得することができる。例えば、該素材リソースにおいて、第1の所定数(例えば、10)フレームの画像毎に、第2の所定数(例えば、1)フレームの画像をサンプリングして、少なくとも1つのサンプル画像を取得することができる。
ステップ305:少なくとも1つのサンプル画像における各サンプル画像について、該サンプル画像を意味分割し、該サンプル画像に対応する少なくとも1つの意味アノテーション結果を取得するとともに、取得された少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する意味ベクトルに基づいて、該サンプル画像に対応する意味ベクトルを確定する。
ここで、ステップ305において、各サンプル画像を意味分割し、そして各サンプル画像について、取得された少なくとも1つの意味アノテーション結果における各意味アノテーション結果に対応する意味ベクトルに基づいて、該サンプル画像に対応する意味ベクトルを確定する具体的な動作は、ステップ303で説明したそれぞれの具体的な動作とほぼ同じであるため、ここでは省略する。
ステップ306:各サンプル画像に対応する意味ベクトルに基づいて、該素材リソースに対応する意味ベクトルを確定する。
ステップ305において各サンプル画像に対応する意味ベクトルが取得されたため、ここでは、ステップ305で取得された各サンプル画像に対応する意味ベクトルに基づいて、該素材リソースに対応する意味ベクトルを確定することができる。例えば、各サンプル画像に対応する意味ベクトルの平均値ベクトルを、該素材リソースに対応する意味ベクトルとして確定することができる。また、例えば、各サンプル画像に対応する意味ベクトルの各次元値の中間値に対応するベクトルを、該素材リソースに対応する意味ベクトルとして確定することもできる。また、例えば、各サンプル画像に対応する意味ベクトルのうち、モジュールが最大またはモジュールが最小の意味ベクトルを、該素材リソースに対応する意味ベクトルとして確定することもできる。
ステップ306を経て、映像素材リソースに対応する意味ベクトルが確定された。
ステップ307:該音声素材リソースについて音声認識を行い、該音声素材リソースに対応する音声認識結果テキストを取得する。
なお、音声認識は現在広く研究され応用されている公知技術であるため、ここではその説明を省略する。
ステップ308:取得された音声認識結果テキストの意味ベクトルを、該音声素材リソースに対応する意味ベクトルとして確定する。
ここで、様々な実施方法で、音声認識結果テキストに対応する意味ベクトルを確定することができる。すなわち、計算の便宜上、音声認識結果テキストをベクトル形式で表現することが考えられる。
例えば、バッグオブワーズモデルを用いて、音声認識結果テキストに対応する意味ベクトルを生成することができる。具体的には、Vをバッグオブワーズモデルにおける辞書に含まれる単語の数とすると、音声認識結果テキストTについて、Tに含まれる辞書における1番目の単語〜V番目の単語の数をそれぞれx〜xとする。そうすると、音声認識結果テキストTに対応するベクトルは{x,x,…,x}となる。
また、例えば、音声認識結果テキストを単語分割し、音声認識結果テキストに対応する分割単語シーケンスを取得し、取得された分割単語シーケンスにおける各分割単語について、予め定められた単語ベクトルテーブルから、該分割単語に対応する単語ベクトルをクエリし、取得された分割単語シーケンスにおける各分割単語に対応する単語ベクトルに基づいて、該音声認識結果テキストに対応する意味ベクトルを確定することもできる。例えば、取得された分割単語シーケンスにおける各分割単語に対応する単語ベクトルの平均値ベクトルを、該音声認識結果テキストに対応する単語ベクトルとして確定することができる。また、例えば、取得された分割単語シーケンスにおける各分割単語に対応する単語ベクトルの各次元の取り得る値の中間値に対応するベクトルを、該音声認識結果テキストに対応する単語ベクトルとして確定することもできる。ここで、単語ベクトルテーブルは、単語と単語ベクトルとの対応関係を表す。単語ベクトルテーブルは、予めトレーニングして取得されたものであり得る。例えば、統計に基づく方法または言語モデルに基づく方法でトレーニングすることにより、単語ベクトルテーブルを取得することができる。
ステップ308により、音声素材リソースに対応する意味ベクトルを確定できる。
ステップ2023:見つけられた素材リソースを素材リソースのセットとして確定する。
ここで、ステップ2022で見つけられた素材リソースを素材リソースのセットとして確定することができる。
本実施形態のいくつかのオプションの実施方法では、ステップ202は、図2Cに示されるステップ2021’とステップ2022’をさらに含むことができる。図2Cを参照すると、本出願に係るステップ202の別の実施形態の分解フローチャートが示されている。
ステップ2021’:対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリする。
ここで、まず、素材リソースに対応する意味ベクトルを確定し、次に、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリすることができる。
素材リソースに対応する意味ベクトルをどのように確定するかについては、図3に示される実施形態におけるステップ301〜308の関連説明を参照することができるため、ここではその説明を省略する。
クエリテキストに対応する意味ベクトルをどのように確定するかについては、図3に示される実施形態におけるステップ308に記載される、音声認識結果テキストの意味ベクトルの確定に関する関連記述を参照することができるため、ここではその説明を省略する。
ステップ2022’:見つけられた素材リソースを素材リソースのセットとして確定する。
ここで、ステップ2021’で見つけられた素材リソースを素材リソースのセットとして確定することができる。
ステップ203:素材リソースのセットを提示する。
本実施形態では、上記の実行主体は様々な実施方法で素材リソースのセットを提示することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、素材リソースのセットをローカルに提示することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、素材リソースのセットを端末装置に送信し、受信された素材リソースのセットを提示するように上記の端末装置を制御することもできる。ここで、上記の端末装置は、ステップ201におけるユーザによって入力されたクエリテキストを受信する端末装置と同じであってもよい。
ここで、一度に素材リソースのセットにおける一部の素材リソースを提示することも、一度に素材リソースのセットにおけるすべての素材リソースを提示することも可能である。画像タイプの素材リソースを提示する際に、素材リソースのサムネイルを提示してもよく、素材リソースの原図を提示してもよい。映像タイプの素材リソースを提示する際に、映像素材リソースの1フレーム目の映像画像のサムネイルまたは原図を提示することができる。音声タイプの素材リソースを提示する際に、音声素材リソースを含むサムネイルを提示することができる。音声素材リソースのサムネイルは、音声素材リソースの再生時間長と音声名称のうちの少なくとも1つを含むことができる。
ステップ204:提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定する。
本実施形態では、上記の実行主体は、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信した場合に、素材リソースシーケンスを確定することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、ローカルに提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作をローカルに受信することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、上記の実行主体とネットワークを介して接続された端末装置から、端末装置上に提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を遠隔的に受信することもできる。
本実施形態では、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作は、様々な操作であり得る。例えば、選択操作は、クリック、ドラッグ、動かしなどを含むが、これらに限定されない。
本実施形態では、提示された素材リソースのセットにおける素材リソースに対するユーザのソート操作は、素材リソース間の前後の再生順位を表す様々な操作であってもよい。例えば、素材リソース間の再生順位の時間軸インターフェースを提供し、そして、ユーザが提示された素材リソースのサムネイルまたは原図を時間軸インターフェースにドラッグする操作を受信することができる。
本実施例では、上記の実行主体は、ユーザの選択操作に対応する素材リソースを素材リソースシーケンスにおける素材リソースとして確定し、そして、ユーザのソート操作に対応する素材リソース間の順位に基づいて、素材リソースシーケンスにおける各素材リソース間の順位を確定することができる。
ステップ205:素材リソースシーケンスに基づいて映像を生成する。
本実施形態では、上記の実行主体は、様々な実施方法で、ステップ204で確定された素材リソースシーケンスに基づいて、映像を生成することができる。
本実施形態のいくつかのオプション実施方法では、ステップ205は、図2Dに示されるステップ2051〜2053を含むことができる。図2Dを参照すると、本出願に係るステップ205の一実施形態の分解フローチャートが示されている。
ステップ2051:素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を第1の映像として確定する。
ここで、生成された映像における画像素材リソースの再生時間長は、所定の画像再生時間長であり得る。すなわち、ここで、素材リソースシーケンスにおける各画像および映像素材リソースを、素材リソースシーケンスにおける画像または映像素材リソースの順位に従って接続することができる。
ステップ2052:素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を第1の音声として確定する。
ここで、素材リソースシーケンスにおける音声素材リソースの順位に基づいて、素材リソースシーケンスにおける各音声素材リソースを接続することができる。
ステップ2053:第1の映像と第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定する。
本実施形態のいくつかのオプションの実施方法では、ステップ205は、図2Eに示されるステップ2051’〜2055’を含むこともできる。図2Eを参照すると、本出願に係るステップ205の別の実施形態の分解フローチャートが示されている。
ステップ2051’:対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリする。
ここで、上記の実行主体は、様々な実施方法で、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリすることができる。
いくつかの実施方法では、上記の実行主体は、ウェブクローラーを利用して、複数のサイトでクエリテキストに関連するページをキャプチャし、キャプチャしたページにおいて、対応する意味ベクトルとクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリすることができる。
ステップ2052’:得られたテキストクエリ結果に基づいて、テキストクエリ結果の要約を確定する。
ここで、様々な実施方法で、得られたテキストクエリ結果に基づいて、テキストクエリ結果の要約を確定することができる。
いくつかの実施方法では、上記の実行主体は、まず、ステップ2051’で得られたテキストクエリ結果を提示し、次いで、ユーザが提示されたテキストクエリ結果に基づいて入力したテキストを受信してテキストクエリ結果の要約とすることができる。例えば、ユーザは、提示されたテキストクエリ結果をベースに、コピー、ペースト、入力などの操作を実行することができる。
いくつかの実施方法では、上記の実行主体は、様々な実施方法で、得られたテキストクエリ結果を要約抽出し、要約抽出によって取得された要約をテキストクエリ結果の要約とすることも可能である。なお、テキストをどのように要約抽出するかは、現在幅広く研究され応用されている公知技術であるため、ここではその説明を省略する。例えば、注意モデル(Attention Model)、Pointer―Generator Networksなどを用いて、テキストの要約抽出を行うことができる。
ステップ2053’:音声合成技術によりテキストクエリ結果の要約に対応する音声を第2の音声として生成する。
なお、音声合成技術は現在幅広く研究され応用されている公知技術であるため、ここではその説明を省略する。
ステップ2054’:素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得する。
ステップ2055’:第2の音声と第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定する。
次に図4を参照すると、図4は、本実施形態に係る映像を生成するための方法の適用シナリオの概略図を示している。図4の適用シナリオでは、まず、サーバ401はユーザが入力したクエリテキスト402を受信し、そして、サーバ401はクエリテキスト402に関連する素材リソースセット403をクエリし、次いで、サーバ401は素材リソースセット403を提示し、その後、サーバ401は提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンス404を確定し、最後に、サーバ401は素材リソースシーケンス404に基づいて映像405を生成することができる。
本出願の上記の実施形態によって提供される方法は、まず、ユーザが入力したクエリテキストを受信し、そして、クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリし、次いで、素材リソースのセットを提示し、その後、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信し、素材リソースシーケンスを確定し、最後に、素材リソースシーケンスに基づいて映像を生成することにより、ユーザが入力したクエリテキストに基づいて素材リソースをユーザに提供し、提供された素材リソースに対するユーザの選択操作とソート操作に基づいて映像を生成することで、ユーザによる映像生成のコストを削減できる。
さらに図5を参照すると、映像を生成するための方法の別の実施形態のプロセス500が示されている。該映像を生成するための方法のプロセス500は、次のステップ(ステップ501〜506)を含む。
ステップ501:ユーザによって入力されたクエリテキストを受信する。
ステップ502:クエリテキストに関連する素材リソースのセットをクエリする。
ステップ503:素材リソースのセットを提示する。
ステップ504:提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定する。
ステップ505:素材リソースシーケンスに基づいて映像を生成する。
本実施形態では、ステップ501、ステップ502、ステップ503、ステップ504、およびステップ505の具体的な動作は、図2に示される実施形態におけるステップ201、ステップ202、ステップ203、ステップ204、およびステップ205の動作とほぼ同じであるため、ここではそれらの説明を省略する。
ステップ506:生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生する。
本実施形態のいくつかのオプションの実施方法では、映像を生成するための方法の実行主体(例えば、図1に示されるサーバ)は、生成された映像の再生を指示するための再生リクエストをローカルに受信した場合、生成された映像をローカルに再生することができる。
本実施形態のいくつかのオプションの実施方法では、上記の実行主体は、上記の実行主体とネットワークを介して接続された端末装置から、生成された映像の再生を指示するための再生リクエストを遠隔的に受信した場合、生成された映像を上記の端末装置に送信し、受信された映像をローカルに再生するように上記の端末装置を制御することもできる。
図5から分かるように、本実施形態における映像を生成するための方法のプロセス500は、図2Aに対応する実施形態に比べて、「再生リクエストを受信した場合、生成された映像を再生する」というステップが追加されている。これにより、本実施形態で説明した技術的解決手段は、生成された映像を再生することができ、ユーザは、生成された映像をプレビューしたうえ、映像の編集を行い、編集が完了した後に再度プレビューすることができるため、ユーザによる映像作成・編集のコストを削減できる。
さらに図6を参照すると、上記の各図に示される方法の実施として、本出願は映像を生成するための装置の一実施形態を提供した。該装置は、その実施形態が図2Aに示される方法の実施形態に対応しており、具体的に、様々な電子機器に適用することができる。
図6に示されるように、本実施形態に係る映像を生成するための装置600は、受信ユニット601と、クエリユニット602と、提示ユニット603と、確定ユニット604と、生成ユニット605と、を含む。ここで、受信ユニット601は、ユーザが入力したクエリテキストを受信するように構成されている。クエリユニット602は、上記のクエリテキストに関連する、画像、映像、または音声である素材リソースのセットをクエリするように構成されている。提示ユニット603は、上記の素材リソースのセットを提示するように構成されている。確定ユニット604は、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースのシーケンスを確定するように構成されている。生成ユニット605は、上記の素材リソースシーケンスに基づいて映像を生成するように構成されている。
本実施形態では、映像を生成するための装置600の受信ユニット601、クエリユニット602、提示ユニット603、確定ユニット604、および生成ユニット605の具体的な処理とそれによる技術的効果は、それぞれ図2Aに対応する実施形態におけるステップ201、ステップ202、ステップ203、ステップ204、およびステップ205に関する説明を参照することができるため、ここではそれらの説明を省略する。
本実施形態のいくつかのオプションの実施方法では、上記のクエリユニット602は、上記のクエリテキストを単語分割し、上記のクエリテキストに対応する分割単語シーケンスを取得するように構成された単語分割モジュール6021と、上記の分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリするように構成された第1のクエリモジュール6022と、見つけられた素材リソースを素材リソースのセットとして確定するように構成された第1の確定モジュール6023と、を含むことができる。
本実施形態のいくつかのオプションの実施方法では、上記の第1のクエリモジュール6022はさらに、対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値の素材リソースよりも大きい素材リソースをクエリするように構成され得る。
本実施形態のいくつかのオプションの実施方法では、上記のクエリユニット602は、対応する意味ベクトルと上記のクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリするように構成された第2のクエリモジュール6021’と、見つけられた素材リソースを上記の素材リソースのセットとして確定するように構成された第2の確定モジュール6022’と、を含むこともできる。
本実施形態のいくつかのオプションの実施方法では、上記の生成ユニット605は、上記の素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を第1の映像として確定するように構成された第3の確定モジュール6051と、上記の素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を第1の音声として確定するように構成された第4の確定モジュール6052と、上記の第1の映像と上記の第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定するように構成された第5の確定モジュール6053とを含むことができる。
本実施形態のいくつかのオプションの実施方法では、上記の生成ユニット605は、対応する意味ベクトルと上記のクエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリするように構成された第3のクエリモジュール6051’と、得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定するように構成された第6の確定モジュール6052’と、音声合成技術を利用して、上記のテキストクエリ結果の要約に対応する音声を第2の音声として生成するように構成された音声合成モジュール6053’と、上記の素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得するように構成された接続モジュール6054’と、上記の第2の音声と上記の第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定するように構成された第7の確定モジュール6055’と、を含むこともできる。
本実施形態のいくつかのオプションの実施方法では、上記の装置600は、生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生するように構成された再生ユニット606をさらに含むことができる。
なお、本出願の実施形態によって提供される映像を生成するための装置における各ユニットの実施の詳細および技術的効果は、本出願における他の実施形態の説明を参照することができるため、ここではそれらの説明を省略する。
次に図7を参照すると、本出願の一実施形態を実施するためのサーバに適するコンピュータシステム700の概略構造図が示されている。図7に示されるサーバは、あくまでも一例にすぎず、本出願の実施形態の機能および使用範囲に如何なる制限も課すべきではない。
図7に示されるように、コンピュータシステム700は、読み取り専用メモリ(ROM、Read Only Memory)702に記憶されたプログラムまたは記憶部708からランダムアクセスメモリ(RAM、Random Access Memory)703にロードされたプログラムにより、様々な適切な動作および処理を実行できる1つまたは複数の中央処理装置701(CPU、Central Processing Unit)を含み得る。RAM703には、システム700の動作に必要な各種プログラムやデータも記憶されている。CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。入出力(I/O、Input/Output)インターフェース705もバス704に接続されている。
I/Oインターフェース705には、キーボード、マウスなどを含む入力部706と、例えば陰極線管(CRT、Cathode Ray Tube)、液晶ディスプレイ(LCD、Liquid Crystal Display)およびスピーカなどを含む出力部707と、ハードディスクなどを含む記憶部708と、例えばLAN(ローカルエリアネットワーク、Local Area Network)カードやモデムなどのネットワークインターフェースカードを含む通信部709とが接続されている。通信部709は、例えばインターネットなどのネットワークを介して通信処理を行う。ドライバ710も、必要に応じてI/Oインターフェース705に接続されている。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのリムーバブルメディア711が必要に応じてドライバ710に装着され、リムーバブルメディア711から読み出されたコンピュータプログラムが必要に応じて記憶部708にインストールされるようにする。
特に、本開示の実施形態によると、フローチャートを参照して説明されたプロセスは、コンピュータソフトウェアプログラムとして実施され得る。例えば、本開示の実施形態には、コンピュータ可読媒体に記憶されたコンピュータプログラムを含むコンピュータプログラム製品が含まれる。該コンピュータプログラムは、フローチャートに示される方法を実行するためのプログラムコードを含む。そのような実施形態では、該コンピュータプログラムは、通信部709を介してネットワークからダウンロードしてインストールすることができ、および/またはリムーバブルメディア711からインストールすることができる。該コンピュータプログラムが中央処理装置(CPU)701によって実行されると、本開示の実施形態の方法において定義された上述の機能を実行する。本開示の実施形態で説明されたコンピュータ可読媒体は、コンピュータ可読信号媒体、コンピュータ可読記憶媒体、またはこれらの2つの任意の組み合わせであり得ることに留意されたい。コンピュータ可読記憶媒体は、例えば、電子、磁気、光学、電磁気、赤外線、または半導体のシステム、装置もしくはデバイス、または上記の任意の組み合わせであり得るが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、1本または複数のワイヤを有する電気接続、ポータブルコンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD−ROM)、光学記憶装置、磁気記憶装置、または上記の任意の適切な組み合わせを含むが、これらに限定されない。本開示の実施形態では、コンピュータ可読記憶媒体は、プログラムを含むまたは記憶する任意の有形の媒体であり得る。該プログラムは、命令実行システム、装置もしくはデバイスによって使用されるか、またはそれらに組み合わせて使用されてもよい。本開示の実施形態では、コンピュータ可読信号媒体はベースバンドに含まれるか、またはキャリアの一部として伝播されるデータ信号を含み得る。コンピュータ可読信号媒体には、コンピュータで読み取り可能なプログラムコードが記憶されている。そのような伝播されるデータ信号は、電磁信号、光信号、または上記の任意の適切な組み合わせを含むがこれらに限定されない様々な形態をとることができる。コンピュータ可読信号媒体はさらに、命令実行システム、装置もしくはデバイスによって使用されるか、またはそれらに組み合わせて使用されるプログラムを送信、伝播、または伝送できる、コンピュータ可読記憶媒体以外の任意のコンピュータ可読媒体であり得る。コンピュータ可読媒体に記憶されているプログラムコードは、ワイヤレス、ワイヤ、光ファイバケーブル、RF(無線周波数)など、または上記の任意の適切な組み合わせを含むがこれらに限定されない任意の適切な媒体によって送信され得る。
本出願の実施形態の動作を実行するためのコンピュータプログラムコードは、1つまたは複数のプログラミング言語、またはそれらの組み合わせで書くことができる。プログラミング言語は、Java(登録商標)、Smalltalk、C++などのオブジェクト指向プログラミング言語や、「C」言語または類似するプログラミング言語などの従来の手続き型プログラミング言語を含む。プログラムコードは、完全にユーザのコンピュータ上で実行されることも、部分的にユーザのコンピュータ上で実行されることも、スタンドアロンソフトウェアパッケージとして実行されることも、部分的にユーザのコンピュータ上で実行されながら部分的にリモートコンピュータ上で実行されることも、または完全にリモートコンピュータまたはサーバ上で実行されることも可能である。リモートコンピュータの場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてもよい。または、外部のコンピュータに接続されてもよい(例えば、インターネットサービスプロバイダーによるインターネット経由で接続される)。
添付図面のうちのフローチャートおよびブロック図は、本出願の様々な実施形態に係るシステム、方法、およびコンピュータプログラム製品の実施可能なアーキテクチャ、機能、および動作を示している。ここで、フローチャートまたはブロック図における各ブロックは、モジュール、プログラムセグメント、またはコードの一部を表すことができる。該モジュール、プログラムセグメント、またはコードの一部は、指定されたロジック機能を実施するための1つまたは複数の実行可能な命令を含む。また、いくつかの代替的な実施形態では、ブロックに記載されている機能は、図面に示されているものとは異なる順序で発生する場合があることにも留意されたい。例えば、連続して表されている2つのブロックは、実際にほぼ並行して実行されてもよく、時には逆の順序で実行されてもよい。これは関連する機能によって決まる。また、ブロック図および/またはフローチャートにおける各ブロック、並びにブロック図および/またはフローチャートにおけるブロックの組み合わせは、指定された機能または動作を実行する専用のハードウェアベースのシステムで実施することも、または専用のハードウェアとコンピュータの命令の組み合わせで実施することも可能であることに留意されたい。
本出願の実施形態において説明されたユニットは、ソフトウェアまたはハードウェアによって実施され得る。説明されたユニットはプロセッサに内蔵されてもよい。例えば、「受信ユニットと、クエリユニットと、提示ユニットと、確定ユニットと、生成ユニットと、を含むプロセッサ」と説明することができる。ここで、これらのユニットの名称は、そのユニット自体に対する制限を構成しない場合がある。例えば、受信ユニットは、「ユーザによって入力されたクエリテキストを受信するユニット」と説明することができる。
別の態様では、本出願はまた、上記の実施形態で説明した装置に含まれ得るか、または別個に存在し、装置に組み込まれないコンピュータ可読媒体を提供する。上記のコンピュータ可読媒体には1つまたは複数のプログラムが格納されており、上記の1つまたは複数のプログラムが上記の装置によって実行されると、該装置は、ユーザが入力したクエリテキストを受信し、クエリテキストに関連する、画像、映像、または音声である素材リソースのセットをクエリし、素材リソースのセットを提示し、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定し、素材リソースシーケンスに基づいて映像を生成する。
さらに別の態様では、本出願の実施形態は、インターフェースと、1つまたは複数のプログラムが格納されているメモリと、インターフェースに動作可能に接続された1つまたは複数のプロセッサと、を含む別のサーバをさらに提供する。上記のプロセッサは、ユーザが入力したクエリテキストを受信し、クエリテキストに関連する、画像、映像、または音声である素材リソースのセットをクエリし、素材リソースのセットを提示し、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定し、素材リソースシーケンスに基づいて映像を生成する。
さらに別の態様では、本出願の実施形態は、コンピュータプログラムが格納されているコンピュータ可読記憶媒体を提供する。上記のコンピュータプログラムが1つまたは複数のプロセッサによって実行されると、上記の1つまたは複数のプロセッサは、ユーザが入力したクエリテキストを受信し、クエリテキストに関連する、画像、映像、または音声である素材リソースのセットをクエリし、素材リソースのセットを提示し、提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定し、素材リソースシーケンスに基づいて映像を生成する。
上記の説明は、あくまでも本出願の好ましい実施形態および応用技術原理の説明にすぎない。本出願に係る発明の範囲は、上記の技術的特徴の特定の組み合わせによって形成された技術的解決手段に限定されず、上記の発明の構想から逸脱しない範囲で上記の技術的特徴またはその同等の技術的特徴の任意の組み合わせによって形成されたその他の技術的解決手段、例えば、上記の特徴と本出願に開示された同様の機能を有する技術的特徴(それだけに限定されない)とが相互に代替することによって形成された技術的解決手段もカバーしていることを当業者は理解すべきである。

Claims (16)

  1. ユーザによって入力されたクエリテキストを受信するステップと、
    前記クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするステップと、
    前記素材リソースのセットを提示するステップと、
    提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するステップと、
    前記素材リソースシーケンスに基づいて映像を生成するステップと、を含む、映像を生成するための方法。
  2. 前記クエリテキストに関連する素材リソースのセットをクエリするステップは、
    前記クエリテキストを単語分割して、前記クエリテキストに対応する分割単語シーケンスを取得することと、
    前記分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることと、
    見つけられた素材リソースを素材リソースのセットとして確定することと、を含む、請求項1に記載の方法。
  3. 該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリすることは、
    対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリすることを含む、請求項2に記載の方法。
  4. 前記クエリテキストに関連する素材リソースのセットをクエリするステップは、
    対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリすることと、
    見つけられた素材リソースを前記素材リソースのセットとして確定することと、を含む、請求項1に記載の方法。
  5. 前記素材リソースシーケンスに基づいて映像を生成するステップは、
    前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を、第1の映像として確定することと、
    前記素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を、第1の音声として確定することと、
    前記第1の映像と前記第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定することと、を含む、請求項1に記載の方法。
  6. 前記素材リソースシーケンスに基づいて映像を生成するステップは、
    対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリすることと、
    得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定することと、
    音声合成技術により前記テキストクエリ結果の要約に対応する音声を第2の音声として生成することと、
    前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得することと、
    前記第2の音声と前記第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定することと、を含む、請求項1に記載の方法。
  7. 前記方法は、
    生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生することをさらに含む、請求項1に記載の方法。
  8. ユーザによって入力されたクエリテキストを受信するように構成された受信ユニットと、
    前記クエリテキストに関連する、画像、映像または音声である素材リソースのセットをクエリするように構成されたクエリユニットと、
    前記素材リソースのセットを提示するように構成された提示ユニットと、
    提示された素材リソースのセットにおける素材リソースに対するユーザの選択操作とソート操作を受信したことに対応して、素材リソースシーケンスを確定するように構成された確定ユニットと、
    前記素材リソースシーケンスに基づいて映像を生成するように構成された生成ユニットと、を含む、映像を生成するための装置。
  9. 前記クエリユニットは、
    前記クエリテキストを単語分割し、前記クエリテキストに対応する分割単語シーケンスを取得するように構成された単語分割モジュールと、
    前記分割単語シーケンスにおける分割単語について、該分割単語とのマッチング度が所定マッチング度閾値よりも大きい素材リソースをクエリするように構成された第1のクエリモジュールと、
    見つけられた素材リソースを素材リソースのセットとして確定するように構成された第1の確定モジュールと、を含む、請求項8に記載の装置。
  10. 前記第1のクエリモジュールはさらに、
    対応する意味ベクトルと該分割単語の単語ベクトルとの類似度が第1の所定類似度閾値よりも大きい素材リソースをクエリするように構成されている、請求項9に記載の装置。
  11. 前記クエリユニットは、
    対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きい素材リソースをクエリするように構成された第2のクエリモジュールと、
    見つけられた素材リソースを前記素材リソースのセットとして確定するように構成された第2の確定モジュールと、を含む、請求項8に記載の装置。
  12. 前記生成ユニットは、
    前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して取得された映像を第1の映像として確定するように構成された第3の確定モジュールと、
    前記素材リソースシーケンスにおける各音声素材リソースを順次接続して取得された音声を第1の音声として確定するように構成された第4の確定モジュールと、
    前記第1の映像と前記第1の音声をそれぞれ、生成される映像における映像部分と音声部分として確定するように構成された第5の確定モジュールとを含む、請求項8に記載の装置。
  13. 前記生成ユニットは、
    対応する意味ベクトルと前記クエリテキストの意味ベクトルとの類似度が第2の所定類似度閾値よりも大きいテキストクエリ結果をクエリするように構成された第3のクエリモジュールと、
    得られたテキストクエリ結果に基づいてテキストクエリ結果の要約を確定するように構成された第6の確定モジュールと、
    音声合成技術により前記テキストクエリ結果の要約に対応する音声を第2の音声として生成するように構成された音声合成モジュールと、
    前記素材リソースシーケンスにおける各画像および映像素材リソースを順次接続して、第2の映像を取得するように構成された接続モジュールと、
    前記第2の音声と前記第2の映像をそれぞれ、生成される映像における音声部分と映像部分として確定するように構成された第7の確定モジュールと、を含む、請求項8に記載の装置。
  14. 前記装置は、
    生成された映像の再生を指示するための再生リクエストを受信したことに対応して、生成された映像を再生するように構成された再生ユニットをさらに含む、請求項8に記載の装置。
  15. 1つまたは複数のプロセッサと、1つまたは複数のプログラムが格納されている記憶装置と、を含むサーバであって、
    前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項1〜7のいずれか1項に記載の方法を実施させるサーバ。
  16. コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、
    前記コンピュータプログラムは、1つまたは複数のプロセッサによって実行されると、請求項1〜7のいずれか1項に記載の方法を実施する、コンピュータ可読記憶媒体。

JP2019219315A 2019-04-08 2019-12-04 映像を生成するための方法および装置 Active JP7113000B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910277152.9 2019-04-08
CN201910277152.9A CN111866609B (zh) 2019-04-08 2019-04-08 用于生成视频的方法和装置

Publications (2)

Publication Number Publication Date
JP2020173776A true JP2020173776A (ja) 2020-10-22
JP7113000B2 JP7113000B2 (ja) 2022-08-04

Family

ID=72663186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019219315A Active JP7113000B2 (ja) 2019-04-08 2019-12-04 映像を生成するための方法および装置

Country Status (3)

Country Link
US (1) US10910014B2 (ja)
JP (1) JP7113000B2 (ja)
CN (1) CN111866609B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287168A (zh) * 2020-10-30 2021-01-29 北京有竹居网络技术有限公司 用于生成视频的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006172133A (ja) * 2004-12-15 2006-06-29 Canon Inc 情報処理システム、情報処理装置、情報処理方法、プログラム及び記憶媒体
JP2014207527A (ja) * 2013-04-11 2014-10-30 キヤノン株式会社 映像生成装置及びその制御方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398832A (zh) * 2007-09-30 2009-04-01 国际商业机器公司 利用人脸检测的图像搜索方法和系统
US20100211605A1 (en) * 2009-02-17 2010-08-19 Subhankar Ray Apparatus and method for unified web-search, selective broadcasting, natural language processing utilities, analysis, synthesis, and other applications for text, images, audios and videos, initiated by one or more interactions from users
US20120177345A1 (en) * 2011-01-09 2012-07-12 Matthew Joe Trainer Automated Video Creation Techniques
US9443011B2 (en) * 2011-05-18 2016-09-13 Microsoft Technology Licensing, Llc Searching for images by video
CN103838866B (zh) * 2014-03-20 2017-04-05 广东小天才科技有限公司 一种文本转换方法及装置
CN103928039B (zh) * 2014-04-15 2016-09-21 北京奇艺世纪科技有限公司 一种视频合成方法及装置
CN104036010B (zh) * 2014-06-25 2017-05-24 华东师范大学 一种基于半监督cbow的用户搜索词主题分类的方法
US20170104840A1 (en) * 2015-10-08 2017-04-13 Perry M. Spagnola Adaptive system cache
CN105893427A (zh) * 2015-12-07 2016-08-24 乐视网信息技术(北京)股份有限公司 资源搜索方法以及服务器
CN108416028B (zh) * 2018-03-09 2021-09-21 北京百度网讯科技有限公司 一种搜索内容资源的方法、装置及服务器
CN109036425B (zh) * 2018-09-10 2019-12-24 百度在线网络技术(北京)有限公司 用于操作智能终端的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006172133A (ja) * 2004-12-15 2006-06-29 Canon Inc 情報処理システム、情報処理装置、情報処理方法、プログラム及び記憶媒体
JP2014207527A (ja) * 2013-04-11 2014-10-30 キヤノン株式会社 映像生成装置及びその制御方法

Also Published As

Publication number Publication date
US20200321026A1 (en) 2020-10-08
JP7113000B2 (ja) 2022-08-04
US10910014B2 (en) 2021-02-02
CN111866609B (zh) 2022-12-13
CN111866609A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
US20200241719A1 (en) System and method for visual analysis of on-image gestures
JP6967059B2 (ja) 映像を生成するための方法、装置、サーバ、コンピュータ可読記憶媒体およびコンピュータプログラム
CN109168026B (zh) 即时视频显示方法、装置、终端设备及存储介质
CN107193792B (zh) 基于人工智能的生成文章的方法和装置
JP6971292B2 (ja) 段落と映像を整列させるための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム
CN111866610B (zh) 用于生成信息的方法和装置
JP6681450B2 (ja) 情報処理方法および装置
JP2020008854A (ja) 音声要求を処理するための方法および装置
CN109474843A (zh) 语音操控终端的方法、客户端、服务器
CN109582825B (zh) 用于生成信息的方法和装置
CN110717337A (zh) 信息处理方法、装置、计算设备和存储介质
CN111666416B (zh) 用于生成语义匹配模型的方法和装置
US10600337B2 (en) Intelligent content parsing with synthetic speech and tangible braille production
CN115982376B (zh) 基于文本、多模数据和知识训练模型的方法和装置
CN110929094A (zh) 一种视频标题处理方法和装置
CN111883131B (zh) 语音数据的处理方法及装置
CN111970536B (zh) 一种基于音频生成视频的方法和装置
WO2023016349A1 (zh) 一种文本输入方法、装置、电子设备和存储介质
CN112287168A (zh) 用于生成视频的方法和装置
CN115357755B (zh) 视频生成方法、视频展示方法和装置
CN112069950B (zh) 提取热词的方法、系统、电子设备及介质
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
JP7113000B2 (ja) 映像を生成するための方法および装置
CN113282770A (zh) 一种多媒体推荐系统及方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R150 Certificate of patent or registration of utility model

Ref document number: 7113000

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150