JP2023513095A - 選択および表示のための機械学習によるビデオのキュレーション - Google Patents

選択および表示のための機械学習によるビデオのキュレーション Download PDF

Info

Publication number
JP2023513095A
JP2023513095A JP2022546657A JP2022546657A JP2023513095A JP 2023513095 A JP2023513095 A JP 2023513095A JP 2022546657 A JP2022546657 A JP 2022546657A JP 2022546657 A JP2022546657 A JP 2022546657A JP 2023513095 A JP2023513095 A JP 2023513095A
Authority
JP
Japan
Prior art keywords
web page
short
videos
video
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022546657A
Other languages
English (en)
Inventor
チュウ,エドウィン
バッコー,ステファン
フェン,シ
リー,ウーシ
リュウ,フォング
クワン ルク,ジェリー,ティン
ヤン,ヴィンセント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Loop Now Technologies Inc
Original Assignee
Loop Now Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Loop Now Technologies Inc filed Critical Loop Now Technologies Inc
Publication of JP2023513095A publication Critical patent/JP2023513095A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

機械学習によるビデオのキュレーションに基づくビデオ操作のための技術が開示される。ウェブページのコンテンツがロードされ、コンテンツには、短編ビデオのフレームが含まれる。前記ウェブページのコンテンツは、テキスト情報について分析される。短編ビデオサーバがアクセスされる。短編ビデオサーバから短編ビデオが選択され、この選択には短編ビデオを自動キュレーションすることが含まれる。アダプティブラーニングは、ユーザのウェブページ挙動に基づいて、前記選択のために使用される。アダプティブラーニングは、前記選択の前のユーザのウェブページ挙動を収集することを含む。自動キュレーションは、ニューラルネットワークによって、ウェブページに適した短編ビデオのサブセットを選択することを含む。前記ウェブページフレームには、前記ビデオサーバから取得した前記短編ビデオが取り込まれる。前記短編ビデオの表現は、前記ウェブページ上の前記フレーム内に表示される。前記短編ビデオは、前記フレーム内で自動再生される。

Description

関連出願の相互参照
本出願は、2020年2月5日に出願した米国仮特許出願第62/970,364号「選択および表示のための機械学習によるビデオのキュレーション」および、2020年10月1日に出願した米国仮特許出願第63/086,077号「機械学習によるビデオテンプレートの使用法」の優先権を主張する。
上記の各出願は、許容される管轄権において、その全体が参照により本明細書に組み込まれる。
本出願は、一般にビデオ操作に関し、より詳細には、選択および表示のための機械学習によるビデオのキュレーションに関する。
非常に人気のあるデジタル娯楽の1つは、「ネットサーフィン」であり、ネットサーフィンは一般に、生産的な時間、空き時間、および先延ばししている時間をインターネットに費やすことを指すようになっている。実際、人々はネットサーフィンが大好きである。ネットサーフィンは、研究、教育、または仕事などの有意義な活動を含み得るが、多くの場合、ネットサーフィンは、ショッピング、エンターテイメント、ゲーム、子供もしくはペットの愛らしいビデオの検索、または単に暇つぶしのために行われる。人々は、様々なウェブサイトで見られる豊富なオンライン情報およびコンテンツとつながるために、ネットサーフィン用の様々な電子デバイスを使用する。特定のウェブサイトにアクセスするには、人は自分の電子デバイス上でウェブブラウザを起動し、ウェブアドレスまたはユニフォームリソースロケータ(URL)を入力することによってウェブサイトに移動する。URLは、特定のデジタルアドレスを指し、基本的に、物理的住所に相当するデジタルの住所である。URLによって、その人はホームページまたはランディングページへと導かれる。ウェブサイトホームページには、ニュース、スポーツ、政治、愛らしい子犬のビデオ、可笑しな仕草の子猫のビデオ、販売中の製品またはサービス、などなどを含む様々なコンテンツが提示されている。その人は、物語、スポーツのスコア、陰謀論、または自分にとって興味のあるコンテンツをクリックすることができる。ユーザの観点からすると、面白いウェブサイトを見つけるのは、通常、使い慣れたサイトに移動するか、またはウェブ検索を使うことによって始まる。どちらの手法を使用しても、ユーザは、ネットサーフィン体験を開始するために目的地またはトピックを念頭に置く必要がある。
「大西部(The Wild West)」、またはその収蔵書物全部が床全面に散らばっている図書館とも言い表されるウェブは、特定のコンテンツを見つけるとなると、検索に大きな問題を提起する。オンライン上の数十億のウェブサイトの中から所望のコンテンツを見つける手助けをするために、検索エンジンが開発されてきた。ある人は、「可愛い子犬のビデオ」または「スモールフォームファクタコンピュータ」などの検索文字列を検索エンジンに入力し、検索を開始する。しかしながら、そのような一般的な検索文字列は、膨大な数のヒットをもたらし、可愛い犬だけで約3000億ヒットする。効果的でない検索では、結果が多すぎて、検索を開始する人にとって有用でなかったり、意味がなかったりする。簡潔な検索文字列を書くことが、この問題に対する解決策の示唆となるであろうが、あまりにも簡潔な検索は、実際にその人が探し求めているものに近いかもしれない「ほぼ一致」を排除しかねない。オンライン小売業者のようなプロバイダの観点からすると、そのビジネスが成功するか失敗するかは、見込み客に商品とサービスを提示し、次いで見込み客を購入者へとコンバートすることにかかっている。「正しい」ウェブページは、商品またはサービスを探している潜在的な顧客に迅速に提示されなければならない。そのような提示が行われない場合、顧客は他の所に行くだろうし、あるいは興味を失ったり時間がなくなったりして単にやめてしまうだろう。
ウェブページクリエイタは、彼らのウェブページのランキングを上げ、そのウェブページがウェブを検索するユーザに最初に提示される機会を増やす、検索エンジン最適化(SEO)技術を使用して自分のウェブページを作成する。検索エンジンプロバイダは、検索結果においてウェブページをランク付けするためのSEO技術を使っているウェブページを調査する。これらのランク付けされた検索結果は、ウェブページにユーザを誘導して、そこでユーザが購入することを期待してユーザに提示される。SEOは、いたちごっこに少し似ている。クリエイタは、より高くランク付けされるウェブページを作成しようとする一方で、検索エンジン開発者は、より高いランク付けが正当であるか、または操作されているかを判定しようとする。特定のページへのアクセスを自動化してヒット率を高め、その結果としてその見かけの人気を高めるなど、明らかに欺瞞的で不正な手法は、全くもって推奨されていない。ただし、検索エンジン最適化に対する正当なアプローチは奨励されている。この後者のカテゴリには、ウェブページを作成するためのガイドが含まれ、中でも例えば、ウェブページコード内にメタタイトル、記述子、およびキーワードを埋め込むこと、検索エンジンによって容易にフォローされ得るようにURLを構造化すること、ならびに画像に適切なキーワードをタグ付けすること、などである。適切に行われた場合、SEO技術を使用して作成されたウェブページは、ウェブページのランキングを上げ、ウェブページにユーザを引き付けることに成功する。
デスクトップコンピュータ、ラップトップコンピュータ、タブレット、スマートフォン、およびPDAなどの電子デバイスは、ウェブコンテンツを観察し、ウェブコンテンツとインタラクションしたい人々によって広く使用されている。ウェブコンテンツは、ウェブブラウザ内にウェブページとしてレンダリングされることが多く、ニュース、政府情報、娯楽、教育資料などを提示する。ウェブコンテンツには通常、テキスト、ライブフィードビデオを含むビデオ、オーディオなどが含まれる。ウェブページとインタラクションする個人は、ニュース記事、スポーツチーム、製品またはサービスなどについてより詳しく知ることを選択することができる。さらに情報を求めることには、ウェブ検索の実行が含まれてもよく、ウェブ検索により、数百、数千、またはそれ以上の検索ヒットが生じる。その個人はその後、検索結果のいくつかを試してみるか、さらなる検索を行うか、など決定しなければならない。有名人の最新のゴシップを探すこと、またはニュース速報を追跡することが検索に含まれる場合、総数と上位検索結果の適合度は絞られ、非常に扱いやすく、ユーザは自分の好きな情報源を選択することができる。対照的に、検索が製品またはサービスに関するもので、関連性の低い大量の検索結果を個人が受け取った場合、その人物が、「コンバート」または商品もしくはサービスを購入する可能性が非常に低い。検索結果の数および質を制御するには、検索結果をキュレーションし、個人の情報クエストに高度に関連する少数の結果を選択する方が遥かに効果的であり得る。個人は、妥当な数の関連選択肢が迅速に提示され、上位の検索結果を安全に選択すること、好みの情報源を選択すること、などが可能になる。さらに、アダプティブラーニングなどの人工知能(AI)技術を適用することによって、検索結果の選択および表示をキュレーションするための質および効率を大幅に改善することができる。ウェブページとインタラクションする間の各人の挙動を観察することにより、上位検索結果の選択を大幅に強化することができるため、検索結果の関連性を高め、その個人のユーザ体験(UX)を改善し、個人が閲覧者から購入者または消費者へと「コンバート」する確率を高めることができる。
ビデオ操作は、選択と表示のための機械学習によるビデオのキュレーションに基づいている。ビデオ操作のためのプロセッサ実装方法が開示され、この方法は、ウェブページのコンテンツをロードすることであって、前記コンテンツが複数の短編ビデオのためのフレームを含む、ロードすることと、テキスト情報についてウェブページのコンテンツを分析することと、短編ビデオサーバにアクセスすることと、前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択することであって、前記選択は、前記複数の短編ビデオを自動キュレーションすることを含む、選択することと、前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込むことと、前記ウェブページ上の前記フレーム内に前記複数の短編ビデオの表現を表示することと、を含む。自動キュレーションは、リカレントニューラルネットワークなどのニューラルネットワークを使用して、ウェブページに適した複数の短編ビデオのサブセットを選択することを含み得る。ニューラルネットワークは、長期短期記憶モデルなどのモデルを実装することができ、長期短期記憶モデルは、ニューラルネットワーク内のフィードバックを使用してデータのシーケンスを処理する。データのシーケンスは、スピーチまたはビデオを含むことができる。自動キュレーションは、ディープラーニングなどの機械学習に基づくことができる。機械学習は、ニューラルネットワークに訓練データを適用することによって、自動キュレーションのためにニューラルネットワークを訓練することを含み得る。短編ビデオは、ウェブページ上のフレーム内で自動再生することができる。ウェブページ上のフレーム内に埋め込まれたコールトゥアクションに対する応答を受信することができる。短編ビデオサーバからのコールトゥアクションに対する応答に基づいて、第2の複数の短編ビデオを提供することができる。第2の複数の短編ビデオの基準によって、複数の短編ビデオの自動キュレーションを修正することができる。
自動キュレーションは、アダプティブラーニングを使用して強化または更新され得る。アダプティブラーニングは、個人に関連する情報を収集し、その情報を分析し、分析結果を使用してニューラルネットワークに関連する様々なパラメータまたは相互接続を更新することを含み得る技術である。ニューラルネットワークに関連する更新パラメータは、ニューラルネットワークに関連する重み、バイアス、係数などを更新することを含み得る。アダプティブラーニングに関連し得る収集された情報には、個人のウェブページ挙動、ウェブページ上のスワイプおよび/またはクリック、他の人々のウェブページ挙動との比較などが含まれ得る。ウェブページからの個人に関連付けされたコンテキスト情報および人口統計データも、アダプティブラーニングに使用され得る。より多くのデータが収集および分析されるにつれて、ニューラルネットワークに対して行われる改善の質が向上する。個人は、「オプトイン」を選択することができ、これにより、所与のウェブサイト上でのユーザの使用法またはウェブサイト挙動、および追加のウェブサイト上での挙動、などに関連するさらなる情報を収集することが可能になる。
様々な実施形態の様々な特徴、態様、および利点は、以下のさらなる説明からより明らかになるであろう。
特定の実施形態の以下の詳細な説明は、以下の図を参照することによって理解することができる。
機械学習によるビデオのキュレーションのフロー図である。 キュレーションされたビデオを表示するためのフロー図である。 フレーム付きのウェブページの一例である。 デスクトップ/ラップトップデバイス上の埋め込みビデオを示す。 モバイルデバイス上の埋め込みビデオを示す。 ソースと通信するウェブページのブロック図である。 アダプティブラーニングの使用法のフロー図である。 ビデオ操作のシステム図である。
選択および表示のための機械学習によるビデオのキュレーションに基づくビデオ操作の技術が開示される。デスクトップコンピュータ、ラップトップコンピュータ、タブレット、スマートフォン、携帯情報端末(PDA)などの電子デバイスを使用して、個人によってウェブページがロードされ得る。ロード可能なウェブページは、テキスト、画像、ビデオ、オーディオ、および他のコンテンツを含むことができ、これらコンテンツは、ウェブページに関連するか、またはウェブページに関連付けられた、メッセージ、フィーリングまたは本能的反応、テーマ、体験などを提示する。所与のウェブページ上の情報は有用であり得るが、類似または関連しているウェブページへのアクセスは、個人がウェブページコンテンツを消費する際のユーザ体験を大幅に向上させることが広く知られている。例えば、個人がニュースレポートを消費して、特定のトピックについてもっと多くを知りたい場合、単純な検索では、優に数百または数千の検索結果またはヒットが生まれ得る。無数の結果には、類似のキーワード、トピック、名前などが含まれる場合があるが、結果の大部分の有用性またはメリットには疑問が残り得る。「スマート検索」は、検索結果の数を減らすことができるが、そのような高度な検索方法を知るのは、時間がかかり、ややこしい場合がある。キュレーションによる検索結果の選択は、選択されたウェブページによって個人の体験を大きく向上させる。
選択と表示のための機械学習によるビデオのキュレーションにより、ビデオ操作が可能になる。ウェブページのコンテンツがロードされ、コンテンツには、複数の短編ビデオのフレームが含まれる。ウェブページのコンテンツは、テキスト情報について分析される。ウェブページのコンテンツはさらに、ビデオ情報、オーディオ情報などについて分析され得る。短編ビデオサーバがアクセスされ、短編ビデオサーバは、ウェブページの残りの部分のストレージとコンテンツから分散されている。テキスト情報に基づいて短編ビデオサーバから複数の短編ビデオが選択され、選択には複数の短編ビデオを自動キュレーションすることが含まれる。自動キュレーションは、ニューラルネットワークを使用して、ウェブページに適した複数の短編ビデオのサブセットを選択することを含み得る。ウェブページ上のフレームには、短編ビデオサーバから取得された複数の短編ビデオが取り込まれる。フレームには、水平方向にスクロール可能なフレーム、グリッドなどが含まれ得る。複数の短編ビデオの表現は、ウェブページ上のフレーム内に表示される。複数の短編ビデオは、フレーム内で再生される。ウェブページ上のフレーム内に埋め込まれたコールトゥアクションに対する応答が受信される。第2の複数の短編ビデオが、短編ビデオサーバからのコールトゥアクションに対する応答に基づいて提供され、第2の複数の短編ビデオの基準によって、複数の短編ビデオの自動キュレーションが修正される。ユーザのウェブページ挙動が観察されると、短編ビデオを選択するためにアダプティブラーニングが使用され得る。アダプティブラーニングにより、選択と表示のための機械学習によるビデオのキュレーションが可能になる。アダプティブラーニングは、ユーザのウェブページ挙動に基づくことができる。アダプティブラーニングは、選択が行われる前のユーザのウェブページ挙動、すなわち以前のウェブページ挙動を収集することを含み得る。アダプティブラーニングは、1つのウェブページまたはそのウェブページに関連する複数のウェブページ上でのユーザのスワイプおよび/またはクリックを収集することを含み得る。
図1Aは、機械学習によるビデオのキュレーションのフロー図である。短編ビデオを含み得るビデオには、ニュースビデオ、エンターテインメントビデオ、政治メッセージビデオなどの様々なメディアタイプが含まれ得る。短編ビデオは、数秒、1分などの長さのビデオを含むことができる。ビデオは、個人が使用する電子デバイス上に表示され得る。ビデオは、ウェブページの追加コンテンツの中に含まれてもよく、追加コンテンツは、テキストおよびオーディオを含むことができる。ウェブページは、フレームを含み得る。短編ビデオは、ビデオサーバに保存されてもよく、ビデオサーバは、ウェブページの残りのコンテンツから分散されている。短編ビデオがサーバから選択され、個人が閲覧しているウェブページ上のフレームに取り込むために使用され得る。短編ビデオを取り込むフレームは、水平方向、垂直方向、グリッド、などを含むことができる。フレームは、水平方向、垂直方向、およびグリッド構成においてスクロール可能であり得る。フレーム内の短編ビデオは自動再生され得る。
フロー100は、ウェブページのコンテンツのロード110を含む。ウェブページコンテンツのロードは、ウェブブラウザを使用して達成され得る。ウェブページは、個人が選択したウェブページを含むことができる。ウェブページは、ニュースウェブサイト、eコマースウェブサイト、政府ウェブサイト、などの様々なウェブサイトのコンテンツを含むことができる。ウェブページコンテンツは、テキスト、画像、ビデオ、オーディオ、などを含むことができる。テキストは、フォント、文字、絵文字などを含むことができる。ビデオおよびオーディオは、ビデオ用にはMPEG-4(商標)、Flash(商標)、QuickTime(商標)など、オーディオ用にはMPEG-3(商標)、WAV(商標)、AIFF(商標)など、の様々な規格またはプロトコルに基づくことができる。ロードされるウェブページのコンテンツは、個人がウェブページのコンテンツを表示するために使用する電子デバイスに基づくことができる。個人は、デスクトップコンピュータ、ラップトップコンピュータ、タブレット、スマートフォン、PDA、または他の電子デバイスを使用してウェブページコンテンツをロードすることができる。ロードされるウェブページコンテンツは、ディスプレイサイズ、ディスプレイ解像度、個人によって構成されたダウンロード設定、などに基づいて決定され得る。フロー100において、コンテンツは、112の複数の短編ビデオ用のフレームを含む。全体を通して論じているように、フレームはスクロール可能であり、水平方向、垂直方向、またはグリッド方向に含めることができる。実施形態では、以下で説明するように、フレームを既存のウェブページに追加して、関連する短編ビデオの表示を容易にすることができる。フレームは、ウェブページ内に配置することができ、ウェブページ上のフローティングボックスなどを含むことができる。さらなる実施形態では、ウェブページ上のフレームは、短編ビデオサーバから複数の短編ビデオをプルすることができる。短編ビデオは、ウェブページ上のフレーム内に表示することができる。
フロー100は、テキスト情報についてウェブページのコンテンツを分析すること120を含む。テキスト情報の分析には、1つまたは複数のキーワード、1つまたは複数のキーフレーズ、などのテキストの処理が含まれ得る。テキストデータは、ユーザが見るウェブページ上の実際の単語を含むことができる。テキストデータは、SEOメタデータなどよりもウェブページコンテンツをより純粋に表現することができる。前記分析はさらに、ビデオ情報の分析を含むことができる。ビデオ情報は、ビデオ内の物体、人物、または動物など、ビデオに関連するキーワードを含むことができる。前記分析はさらに、オーディオ情報の分析を含むことができる。オーディオ情報の分析は、自然言語処理を含むことができる。フロー100はさらに、テキスト情報をメタデータによって拡張すること130を含む。メタデータ、すなわち「データに関するデータ」は、分析の結果に加えて情報を提供することができる。メタデータは、タイムスタンプ、ウェブジャーニー情報(例えば、ページ訪問、クリックされたボタン)、ユーザ情報、SEOデータ、クッキーなどを含むことができる。以下で説明するように、メタデータによるテキスト情報の拡張は、メタデータに基づいて複数の短編ビデオを選択するために使用されてもよい。メタデータによる拡張は、ビデオ情報およびオーディオ情報にも適用されてもよい。フロー100はさらに、テキスト情報を画像情報によって拡張すること132と、画像情報に基づいて複数の短編ビデオを選択することとを含む。画像情報によるテキスト情報の拡張は、画像の説明、キーワード、またはフレーズ、および画像コンテンツの説明などを含むことができる。フロー100はさらに、ウェブページから抽出されたテーマによってテキスト情報を拡張すること134を含み、テーマの選択は、メタデータと短編ビデオテーマ情報との関連性のランク付けに基づく。ウェブページテーマは、ウェブページによって伝達される外観、スタイル、ムード、または「フィーリング」を含むことができる。テーマは、喜びまたは悲しみ、恐怖または自己啓発、行動を起こす呼びかけ、愉快または不快などを含むことができる。フロー100は、短編ビデオサーバにアクセスすること140を含む。短編ビデオは、15秒のような数秒、1分などの長さのビデオを含むことができる。短編ビデオは、マーケティング、商業、ニュース、政府、教育、または他の目的のために使用されるビデオを含むことができる。ビデオサーバは、ローカルサーバ、リモートサーバ、クラウドベースのサーバ、グリッドサーバ、などを含むことができる。ビデオサーバは、ウェブページコンテンツおよびレンダリングに関与する他のコンピューティング機能およびストレージ機能から分散されたサーバを含むことができる。
フロー100は、テキスト情報に基づいて、短編ビデオサーバから複数の短編ビデオを選択すること150を含む。複数の短編ビデオは2つ以上のビデオを含むことができ、2つ以上のビデオは実質的に同様のコンテンツを含むことができる。短編は、一般的に関連し得る範囲のコンテンツを提供することができ、一般的な関連には、「ニュース」、「エンターテインメント」、「旅行」などが含まれ得る。使用例では、短編ビデオの選択は、例えば、カリブ海でのスキューバダイビング、ヒマラヤでのトレッキング、またはオーストラリアでのバンジージャンプのような多様な目的地の旅行ビデオを含むことができる。フロー100において、選択は、複数の短編ビデオの自動キュレーション152を含む。短編ビデオの選択のキュレーションは、ユーザの好み、マーケティングメッセージ、などに基づくことができる。さらなる実施形態では、自動キュレーションは、ウェブページにアクセスするユーザによる最近の挙動を追跡する長期短期記憶モデルに基づくことができる。ユーザによる最近の挙動は、訪問されたウェブページ、行われたメニュー選択、クリックされたボタンなどを含むことができる。実施形態では、キュレーションは、ウェブページにアクセスするユーザによって時間的に重み付けされた挙動を使用することができる。時間的に重み付けされた挙動は、所与のウェブページでユーザが費やした時間量、ボタンのクリックまたはスクロールなどのアクション間の時間量、などを含むことができる。
フロー100では、自動キュレーションは、ニューラルネットワークによって、ウェブページに適した複数の短編ビデオのサブセットを選択すること154を含み得る。ニューラルネットワークは、畳み込みニューラルネットワークを含むことができる。実施形態では、ニューラルネットワークは、長期短期記憶モデルに基づくことができ、長期短期記憶モデルは、リカレントニューラルネットワーク上で実行され得る。他のニューラルネットワークのモデルおよび構成を使用することができる。実施形態では、自動キュレーションは機械学習を含むことができる。機械学習は、ディープラーニングニューラルネットワークなどのニューラルネットワーク上で達成され得る。機械学習は、ニューラルネットワークを訓練するために、教師あり、教師なし、または半教師ありの技法を使用して達成され得る。ニューラルネットワークの訓練には、既知の良好なデータの使用を含むことができ、このデータに対する予測結果は、計算、推定、人間の専門家などによって決定されている。他の実施形態では、自動キュレーションは、ウェブページからのコンテキスト情報に基づいてビデオのサブセットを提供する。コンテキスト情報は、ウェブページに関連付けられたキーワード、非表示テキスト、タグ、などを含むことができる。コンテキスト情報は、例えばウェブページがホームページ、製品ページ、ニュース記事ページであるかどうか、などのウェブページ情報を含むことができる。他の実施形態では、コンテキスト情報は、ウェブページからのビデオ情報に基づいていてもよい。ビデオ情報は、ビデオの種類、ビデオコンテンツなどを含み得る。
フロー100は、アダプティブラーニングの使用156を含む。アダプティブラーニングは、ユーザのウェブページ挙動に基づいていてもよい。全体を通して論じているように、短編ビデオは、テキスト情報などの基準に基づいて選択され得る。選択はさらに、短編ビデオの自動キュレーションを含むことができる。ユーザのウェブページ挙動が観察されると、短編ビデオを選択するためにアダプティブラーニングが使用され得る。アダプティブラーニングによって、選択と表示のための機械学習によるビデオのキュレーションが可能になる。アダプティブラーニングは、ユーザのウェブページ挙動に基づくことができる。アダプティブラーニングは、選択が行われる前のユーザのウェブページ挙動、すなわち以前のウェブページ挙動を収集することを含み得る。アダプティブラーニングは、1つのウェブページまたは当該ウェブページに関連する複数のウェブページ上でのユーザのスワイプおよび/またはクリックを収集することを含み得る。アダプティブラーニングは、他のユーザのウェブページ挙動の履歴パターンと当該ユーザの現在のウェブページ挙動とを比較することを含み得る。アダプティブラーニングは、ユーザのウェブページ挙動とウェブページからのコンテキスト情報とを組み合わせることができる。アダプティブラーニングは、ユーザに関する人口統計データを含むことができる。ユーザによる「オプトイン」によって、ユーザに関する追加のウェブページ挙動の収集が可能になる。追加のウェブページ挙動の収集には、追加のウェブサイト上でユーザのウェブページ挙動を監視することが含まれ得る。ユーザは、オプトインをすることで報酬を得ることができる。
フロー100の様々なステップは、開示された概念から逸脱することなく、順番の変更、反復、省略などが可能である。フロー100の様々な実施形態は、1つまたは複数のプロセッサによって実行可能なコードを含むコンピュータ可読媒体で具現化されたコンピュータプログラム製品に含まれ得る。
図1Bは、キュレーションされたビデオを表示するためのフロー図である。フロー102は、ウェブページ上のフレームに、短編ビデオサーバから取得した複数の短編ビデオを取り込むこと160を含む。取り込みは、サーバから複数の短編ビデオを取得することと、短編ビデオをウェブページ上のフレームにロードすることとを含み得る。フロー102は、ウェブページ上のフレーム内に複数の短編ビデオの表現を表示すること170を含む。表現は、短編ビデオの縮小サイズまたは「サムネイル」バージョンを含むことができる。フルサイズのビデオは、ビデオの表現を選択するか、またはクリックすることによって見ることができる。実施形態では、フレームは、複数の短編ビデオの表現を直線的に示すことができる。フレームは、水平構成または垂直構成を含むことができる。フレームに取り込まれる短編ビデオの数は、一度にすべてが見えるとは限らない。フレームはスクロール可能であり得る。他の実施形態では、フレームは、グリッド形式で複数の短編ビデオの表現を示すことができる。グリッドも、スクロール可能であり得る。
フロー102はさらに、フレーム内で複数の短編ビデオを自動再生すること180を含む。フレームにデータが取り込まれると、自動再生が起こり得る。短編ビデオの自動再生は、フレーム内で視認可能なビデオの自動再生を含み得る。フレーム内でスクロールが生じると、フレーム内で視認可能になる短編ビデオが自動再生され得る。自動再生は、ウェブページとインタラクションしている個人がフレーム内の短編ビデオ表現の上にカーソルを移動したときに起こり得る。フロー102はさらに、ウェブページ上のフレーム内に埋め込まれたコールトゥアクションに対する応答を受信すること190を含む。コールトゥアクションは、ウェブページを閲覧している個人に何らかのアクションをとるよう促すことを含み得る。コールトゥアクションには、請願書に署名すること、購入を行うこと、ニュースレターに署名すること、などが含まれ得る。コールトゥアクションに対する応答には、ボタンクリック、ウェブフォームに入力されたデータ、などが含まれ得る。フロー102はさらに、コールトゥアクションに対する応答に基づいて、短編ビデオサーバから第2の複数の短編ビデオを提供すること192を含む。第2の複数の短編ビデオの基準を使用して、複数の短編ビデオの自動キュレーションを修正することができる。第2の複数の短編ビデオは、第1の複数の短編ビデオのサブセット、追加の短編ビデオセット、別の短編ビデオセット、などを含むことができる。
フロー102の様々なステップは、開示された概念から逸脱することなく、順番の変更、反復、省略などが可能である。フロー102の様々な実施形態は、1つまたは複数のプロセッサによって実行可能なコードを含むコンピュータ可読媒体で具現化されたコンピュータプログラム製品に含まれ得る。
図2は、フレーム付きのウェブページの一例である。フレームを含むウェブページをディスプレイ上にレンダリングすることができる。フレームには、ウェブページ内で分析されたテキスト情報の分析に基づいて選択された短編ビデオを取り込むことができる。フレームのコンテンツは、選択と表示のための機械学習によるビデオのキュレーションに基づいて選択される。ウェブページのコンテンツがロードされ、コンテンツには、複数の短編ビデオのフレームが含まれる。ウェブページのコンテンツは、テキスト情報について分析される。短編ビデオサーバがアクセスされる。テキスト情報に基づいて短編ビデオサーバから複数の短編ビデオが選択され、選択には複数の短編ビデオを自動キュレーションすることが含まれる。ウェブページ上のフレームには、短編ビデオサーバから取得した複数の短編ビデオが取り込まれている。複数の短編ビデオの表現は、ウェブページ上のフレーム内に表示される。実施形態は、フレーム内で複数の短編ビデオを自動再生することを含む。
フレーム付きのウェブページの例を200に示す。ウェブページおよびフレームをディスプレイ210上にレンダリングすることができ、ディスプレイは、ラップトップコンピュータまたはデスクトップコンピュータなどのコンピューティングデバイス、およびタブレット、スマートフォン、PDAなどのパーソナル電子デバイス、に関連するディスプレイを含むことができる。ウェブページは、ウェブコンテンツ220を含むことができる。ウェブコンテンツは、テキスト、画像、ビデオクリップ、ビデオ、オーディオ、オーディオクリップ、などを含むことができる。全体を通して論じているように、ウェブページコンテンツは、テキスト情報、ビデオ情報、オーディオ情報などについて分析される。ウェブページから収集した情報の分析に基づいて、複数の短編ビデオが選択される。選択された短編ビデオを使用して、ウェブページコンテンツに含まれるフレーム230を埋めることが可能である。短編ビデオは、240の短編ビデオ1、242の短編ビデオ2、244の短編ビデオ3、246の短編ビデオ4、248の短編ビデオ5、および250の短編ビデオ6を含むことができる。6つの短編ビデオが示されているが、他の数の短編ビデオがウェブページ上のフレームを埋めることができる。
図3は、デスクトップ/ラップトップデバイス300上の埋め込まれたビデオを示す。様々なウェブブラウザを使用して、ラップトップコンピュータ、デスクトップコンピュータ、などの電子デバイス上にウェブページを表示することができる。表示されるウェブページは、短編ビデオサーバから選択された複数の短編ビデオから選択された短編ビデオを取り込むことができるフレームを含み得る。フレーム内の短編ビデオをキュレーションすることができ、キュレーションはビデオ選択に関連する機械学習に基づいている。
ウェブページおよびウェブページ内に含まれるフレームは、ラップトップコンピュータ、デスクトップコンピュータ、などのユーザデバイス上に表示することができる。例えば、ラップトップ上に表示されたウェブページが水平方向にレンダリングされると仮定すると、ウェブページ内のフレームも水平方向にレンダリングされ得る。短編ビデオサーバから複数の短編ビデオが選択されていること、およびウェブページ内のフレームに選択された短編ビデオが取り込まれていることを思い出していただきたい。フレーム内に表示された短編ビデオにアクセスするために、ユーザは、フレーム内で水平方向310にスクロールすることができる。ユーザがウェブページをスクロールダウンしている間、フレーム内の水平スクロールがサポートされ得る。水平スクロールフレームは、記事312の下部またはウェブページの他のウェブコンテンツの下部にあっても視認可能なままである。ウェブページ内のフレームには、他の構成技術を使用することができる。実施形態では、グリッド314は、短編ビデオサーバから選択され、ウェブページ内のフレームを埋めるために使用される複数の短編ビデオの表現を表示するために使用され得る。
ビデオプレーヤを使用して、ユーザによって選択された短編ビデオまたは他のビデオを再生することができる。ビデオプレーヤには、MPEG-4(商標)プレーヤ、Flash(商標)プレーヤ、およびQuickTime(商標)プレーヤなどが含まれ得る。ビデオプレーヤを使用して、選択された短編ビデオを様々な構成で再生することができる。実施形態では、ビデオプレーヤが短編ビデオを再生する構成は、垂直320すなわち縦長の構成または方向を含むことができる。再生のためにユーザによって選択された選択済み短編ビデオは、垂直構成内に収まるようにズーム、スケーリング、トリミングなどを行われてもよい。他の実施形態では、短編ビデオを再生するための構成は、水平322または横長の構成を含むことができる。水平構成は、4:3、16:9、などの一般的なアスペクト比を含む様々なアスペクト比を含むことができる。さらなる実施形態では、短編ビデオを再生するための構成は、正方形324の構成を含むことができる。正方形の構成は、短編ビデオのズーム、スケーリング、トリミングなどによって達成することができる。
図4は、モバイルデバイス上の埋め込みビデオを示す図である。モバイルデバイスを使用して、選択された短編ビデオの表現を含むフレームを表示することが可能なウェブページにアクセスすることができる。短編ビデオの表示は、選択と表示のための機械学習によるビデオのキュレーションに基づき得る。ウェブページのコンテンツがロードされる。コンテンツは、複数の短編ビデオのためのフレームを含む。ウェブページのコンテンツは、テキスト情報について分析される。短編ビデオサーバがアクセスされる。テキスト情報に基づいて、短編ビデオサーバから複数の短編ビデオが選択される。選択は、複数の短編ビデオの自動キュレーションを含む。ウェブページ上のフレームには、短編ビデオサーバから取得した複数の短編ビデオが取り込まれ、複数の短編ビデオの表現がウェブページ上のフレーム内に表示される。
モバイルデバイス上に表示される埋め込みビデオの例が400に示されている。フレームを含むウェブページのコンテンツは、410の水平スクロールを含むことができる。水平スクロールは、短編ビデオサーバから選択されてフレーム内に表示されるビデオ間を横方向にスクロールすることを含み得る。水平スクロールは、所望の短編ビデオを見つけるために左スワイプ、右スワイプなどを含むことができる。次いで、短編ビデオの表現をタップすることによって、前記短編ビデオを選択または再生することができる。選択されたビデオの表現間の水平スクロールを可能にするフレームは、ユーザがウェブページのどこでウェブページコンテンツとインタラクションしているかに関係なく持続することができる。412では、ユーザは、ウェブページ上のウェブコンテンツの最後までスクロールした。選択した短編ビデオのうち、水平方向のスクロールを可能とするフレームは表示されたままであることに注意されたい。他のフレーム構成も含まれ得る。実施形態では、フレームは、414のグリッド内に、選択された短編ビデオの表現を表示することができる。グリッドは、水平方向および垂直方向のスクロールを有効化することができる。
選択した短編ビデオは、ユーザがビデオプレーヤを起動することによって視聴することができる。ビデオプレーヤには、電子デバイスにインストールすることができるビデオプレーヤアプリが含まれてもよい。ビデオプレーヤは、選択した短編ビデオを様々な方向で再生することができる。方向は、ウェブページの開発者によってコード化された方向、電子デバイスの方向、ユーザによって選択された方向、などを含むことができる。実施形態では、ビデオプレーヤは、420の垂直方向で短編ビデオを再生することができる。短編ビデオは、垂直方向に適合させるためにスケーリング、トリミングなどをすることができる。他の実施形態では、ビデオプレーヤは、422の水平方向で短編ビデオを再生することができる。水平方向は、4:3、16:9、「レターボックス」などの様々な表示比を含むことができる。垂直方向については、ビデオプレーヤは、水平方向に表示するための短編ビデオのスケーリング、トリミング、調整などを行うことができる。さらなる実施形態では、ビデオプレーヤは、424の正方形の構成で短編ビデオを再生することができる。短編ビデオは、短編ビデオを正方形構成に適合させるためにスケーリングおよびトリミングすることができる。正方形の構成は、短編ビデオを見やすくするために短編ビデオの中心を最大化するのに有用であり得る。
図5は、500でソースと通信するウェブページのブロック図である。ウェブページとソースとの間の通信により、選択および表示のための機械学習によるビデオのキュレーションが可能になる。ウェブページのコンテンツがロードされ、コンテンツには、複数の短編ビデオのフレームが含まれている。ウェブページのコンテンツはテキスト情報について分析され、短編ビデオサーバがアクセスされる。テキスト情報に基づいて短編ビデオサーバから複数の短編ビデオが選択され、選択には複数の短編ビデオを自動キュレーションすることが含まれる。ウェブページ上のフレームには、短編ビデオサーバから取得した複数の短編ビデオが取り込まれている。複数の短編ビデオの表現は、ウェブページ上のフレーム内に表示される。
全体を通して論じているように、短編ビデオは、短編ビデオサーバによってホストされる複数の短編ビデオから選択され得る。選択は、ユーザが訪問したウェブページに基づいて行うことができる。ウェブページは、ユーザが見ることができる複数のウェブページのうちの1つを含むことができる。ウェブページの分析に基づいて、短編ビデオがサーバから選択され、ユーザによって閲覧されるウェブページに表示される。ユーザは、電子デバイス510を使用してウェブページにアクセスすることができる。電子デバイスには、デスクトップまたはラップトップコンピュータ、タブレットまたはスマートフォン、携帯情報端末(PDA)などが含まれ得る。電子デバイスは、ウェブページ514をレンダリングすることができるディスプレイ512に結合される。ウェブページ上のフレーム516には、ビデオ1の518、ビデオNの520などのビデオが取り込まれている。2つのビデオが示されているが、他の数のビデオをフレーム内に取り込むことができる。電子デバイスは、ウェブページコンテンツ検出器530と通信することができる。電子デバイスとウェブページコンテンツ検出器との間の通信は、無線通信チャネル532などの通信チャネルを使用して達成することができる。ウェブページコンテンツ検出器は、テキスト情報についてウェブページを分析することができる。テキスト情報は、ウェブページ上のテキストを検索することによって検出することができる。さらに、ウェブページタグ、非表示のテキストなどは、テキスト情報を拡張することができる。テキスト情報は、ウェブページからのオーディオデータの自然言語解析に基づいて検出され得る。ウェブページコンテンツ検出器は、人工知能(AI)エンジン540によって制御され得る。畳み込みニューラルネットワークまたはリカレントニューラルネットワークなどのニューラルネットワークに基づき得るAIエンジンを使用して、1つまたは複数の短編ビデオの選択または選別をキュレーションすることができる。選択された短編ビデオを使用して、ウェブページ514内のフレーム516を埋めることができる。AIエンジン540は、アダプティブラーニング542を含むことができる。本明細書で説明するアダプティブラーニングは、AIエンジン540に埋め込まれてもよいし、または分散方式で実施されてもよい。
ウェブページコンテンツ検出器530は、短編ビデオサーバ550にアクセスすることができる。短編ビデオサーバは、ウェブページに関連する他のコンピューティング機能およびストレージ機能から分散させることができる。短編ビデオサーバは、通信チャネル552を介して電子デバイスと通信することができ、通信チャネルは無線通信チャネルを含むことができる。短編ビデオサーバは、複数の短編ビデオを提供することができる。短編ビデオは、短編ビデオデータストレージ554から選択することができる。短編ビデオデータストレージは、分散型ストレージを含むことができる。短編ビデオサーバによって選択された短編ビデオは、電子デバイス510上のフレーム516を埋めるために使用され得る。短編ビデオの表現は、ウェブページ上のフレーム内に表示することができ、表示には、短編ビデオを自動再生することが含まれ得る。
図6は、アダプティブラーニングの使用法のフロー図である。全体を通して論じているように、短編ビデオは、テキスト情報などの基準に基づいて選択され得る。選択はさらに、短編ビデオの自動キュレーションを含むことができる。ユーザのウェブページ挙動が観察されると、短編ビデオを選択するためにアダプティブラーニングが使用され得る。アダプティブラーニングにより、選択と表示のための機械学習によるビデオのキュレーションが可能になる。ウェブページのコンテンツがロードされ、コンテンツには、複数の短編ビデオのフレームが含まれる。ウェブページのコンテンツは、テキスト情報について分析される。短編ビデオサーバがアクセスされる。テキスト情報に基づいて短編ビデオサーバから複数の短編ビデオが選択され、選択には複数の短編ビデオを自動キュレーションすることが含まれる。ウェブページ上のフレームには、短編ビデオサーバから取得した複数の短編ビデオが取り込まれている。複数の短編ビデオの表現は、ウェブページ上のフレーム内に表示される。
フロー600は、選択のためにアダプティブラーニングを使用すること610を含む。アダプティブラーニングは、ユーザに対して短編ビデオの選択を調整するために使用することができる。アダプティブラーニングは、ユーザが行った選択、訪問したウェブサイト、閲覧したコンテンツなどを含むことができる。アダプティブラーニングは、ユーザによって提示された好み、ユーザ識別情報(ID)などに基づくことができる。フロー600において、アダプティブラーニングは、選択の前のユーザのウェブページ挙動を収集すること612を含む。ユーザのウェブページ挙動は、訪問したウェブサイト、選択しメニュー項目、クリックしたラジオボタンなどを含むことができる。ウェブサイト挙動を使用して、ユーザの好みを推測することができる。使用例では、ウェブサイト挙動を使用して、猫より犬、砂漠の島より山の風景、デスメタルレイジよりバロックストリングカルテットを好むなどを始めとした、短編ビデオに対するユーザの好みを決定することができる。ユーザ挙動は、選択する前に、アダプティブラーニングのために観察され得る。ユーザ挙動は、1時間、1日、1週間、ウェブサービスに加入してからの時間、またはアプリを有効にしてからの時間など、過去の使用時間量に基づき得る。ユーザ挙動は、単一のページに関して、およびニュースページまたはエンターテイメントページなどのウェブページのタイプなどに関して、閲覧されたコンテンツ、選択されたメニュー選択、押されたラジオボタンなどに基づき得る。ユーザ挙動は、複数のウェブページにわたるコンテンツまたは選択に基づき得る。
フロー600において、アダプティブラーニングには、ユーザのスワイプおよび/またはウェブページ上のクリック620の収集が含まれる。ユーザによって実行される1つ以上のスワイプは、上、下、左、または右へのスワイプ、および時計回りまたは反時計回りの回転運動でのスワイプなど、を含むことができる。1つまたは複数のスワイプによって、選択または選択解除、承認または非承認、オプションリストなどのリストの中を移動することなどが可能になり得る。1つまたは複数のクリックは、オブジェクト、ラジオボタン、メニュー選択などをクリックすることと、人の指を使ってタッチスクリーンをタッチまたはプレスすることと、マウスまたはトラックパッドなどを使用することとを含み得る。フロー600において、アダプティブラーニングには、ユーザのスワイプおよび/または1つのウェブページに関連する複数のウェブページ上のクリックの収集622が含まれる。1つのウェブページに関連し得る複数のウェブページは、1つのウェブページを通じてアクセス可能な複数のウェブページ、ニュースソース、ショッピングサイト、またはソーシャルネットワークなどの似たようなコンテンツを提供するウェブページ、可愛い子犬や子猫のビデオなどの似たような短編ビデオを提供するウェブページ、アニメ音楽ビデオ(AMV)などを含み得る。
フロー600では、アダプティブラーニングは、他のユーザのウェブページ挙動の履歴パターンと当該ユーザのウェブページ挙動とを比較すること630を含み得る。当該ユーザのウェブページ挙動と他のユーザの履歴パターンとの比較は、ユーザが訪問したいサイト、ウェブページを訪問するためのユーザの目的に関連する短編ビデオといったコンテンツなどを予想するのに有用であり得る。他のユーザは、当該ユーザの友人であってもよいし、そうでなければユーザの関係者や他のユーザの中から選ばれた人などであってもよい。フロー600において、アダプティブラーニングは、ユーザのウェブページ挙動とウェブページからのコンテキスト情報との組み合わせ640を行う。コンテキスト情報は、ユーザがインタラクションしているウェブページの一部またはリージョン、時刻、曜日などを含むことができる。コンテキスト情報によって、選択および表示のための短編ビデオなどのビデオのキュレーションが可能になり得る。コンテキスト情報は、現在のイベント、人気のあるミームなどを含むことができる。
フロー600では、アダプティブラーニングは、ユーザに関する人口統計データを含むこと650ができる。人口統計データは、年齢、性別または性同一性、人種、民族、もしあれば信仰宗教など、ユーザに関連する情報を含むことができる。人口統計データは、雇用状況、教育レベル、収入レベル、結婚または家庭内パートナーシップ状況などの社会経済情報を含むことができる。人口統計データはさらに、州、地域、または居住国など、より一般的なデータを含むことができる。人口統計データによって、年齢に適した素材、文化的に適した素材などを選択するなど、適切なキュレーションに基づいてビデオの選択が可能になり得る。フロー600はさらに、追加のウェブページ挙動を収集するためのユーザによるオプトイン660を含む。オプトインは、登録、ユーザ認証情報の提供、ボタンのクリック、ボックスのチェックなどによって達成することができる。オプトインは、研究データの収集、ユーザ体験の向上などに使用することができる。フロー600において、追加のウェブページ挙動には、追加のウェブサイトでのユーザのウェブページ挙動を監視すること662が含まれる。追加のウェブサイトには、ウェブサイトに関連付けられたウェブサイト、およびウェブサイトに結合されているかまたはウェブサイトにアクセス可能なウェブサイト、などが含まれ得る。追加のウェブサイトには、ユーザがランダムに訪問したウェブサイトが含まれ得る。フロー600はさらに、オプトインに対してユーザに報酬を付与すること664を含む。ユーザの報酬は、最初の購入に割引を提供するなどしてユーザに報酬を与えること、ユーザへお金を支払うこと、短編ビデオなどのビデオにアクセスするのに使用可能なクレジットをユーザに割り当てること、ブロックチェーンクーポンをクレジットすること、などを含むことができる。
図7は、ビデオ操作のシステム図である。ビデオ操作は、選択と表示のための機械学習によるビデオキュレーションに基づいている。システム700は、命令を格納するメモリ712に接続された1つまたは複数のプロセッサ710を含むことができる。システム700は、データ、ビデオ、中間ステップ、命令、短編ビデオなどを表示するために、1つまたは複数のプロセッサ710に結合されたディスプレイ714を含むことができる。実施形態では、1つまたは複数のプロセッサ710は、メモリ712に接続されており、前記1つまたは複数のプロセッサは、格納された命令を実行した場合、ウェブページのコンテンツをロードすることであって、前記コンテンツは、複数の短編ビデオのためのフレームを含む、ロードすることと、テキスト情報について前記ウェブページの前記コンテンツを分析することと、短編ビデオサーバにアクセスすることと、前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択することであって、前記選択は、前記複数の短編ビデオを自動キュレーションすることを含む、選択することと、前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込むことと、前記フレーム内で前記複数の短編ビデオの表現を前記ウェブページ上に表示することと、を行うように構成される。
システム700は、ビデオとデータの収集720を含むことができる。ビデオおよびデータ720は、1つまたは複数のプロセッサに結合された電子ストレージ、データベース、1つまたは複数の静的にリンクされたライブラリ、1つまたは複数の動的にリンクされたライブラリ、または他の適切なビデオまたはデータフォーマットなどのストレージに格納され得る。ビデオは、短編ビデオを含むことができる。短編ビデオは、数秒、十数秒、1分、などを含む時間量で示すことができるビデオを含み得る。短編ビデオは、その短編ビデオの視聴者に迅速かつ効率的にコンテンツを伝えることができる。短編ビデオは、物語、広告、政治的メッセージなどを提示することができる。短編ビデオは、複数のビデオの中から1つのビデオを含むことができ、複数のビデオには、広範囲または多様なコンテンツが含まれ得る。データは、以下に説明するように、ウェブページに関連付けることができるテキスト情報またはデータを含み得る。テキスト情報は、画像情報、テーマ、などによって拡張され得る。システム700は、ロードコンポーネント730を含むことができる。ロードコンポーネント730は、ウェブページのコンテンツをロードするための機能および命令を含むことができる。コンテンツは、例えばウェブページ内のフレームなどのフレームを含むことができる。フレームは、複数の短編ビデオに使用され得る。実施形態では、フレームを既存のウェブページに追加することができる。実施形態は、ウェブページ上のフレーム内に埋め込まれたコールトゥアクションに対する応答を受信することを含み得る。コールトゥアクションは、「ここをクリック」、「今すぐ登録」、「今すぐ購入」などを含むことができる。コールトゥアクションは、登録、金融活動、政治的行動、などを含むことができる。
システム700は、分析コンポーネント740を含むことができる。分析コンポーネント740は、テキスト情報についてウェブページのコンテンツを分析するための機能および命令を含むことができる。テキスト情報には、バナーテキスト、タイトルテキスト、コンテンツテキスト、非表示テキスト、などが含まれ得る。テキスト情報には、画像、ビデオ、GIFなどに関連付けられたテキストが含まれ得る。テキスト情報には、スポンサーの名前または情報、ウェブページの所有権または責任者名または情報、などが含まれ得る。システム700は、アクセスコンポーネント750を含むことができる。アクセスコンポーネント750は、短編ビデオサーバにアクセスするための機能および命令を含むことができる。短編ビデオサーバは、ローカルサーバ、クラウドベースサーバ、メッシュサーバ、などを含むことができる。ビデオサーバを介してアクセス可能な短編ビデオは、広告ビデオ、ソーシャルビデオ、ニュースおよび情報ビデオ、政治的メッセージビデオ、などを含むことができる。短編ビデオサーバを介してアクセス可能な短編ビデオは、MPEG-4(商標)、Flash(商標)、QuickTime(商標)、などのような様々なビデオフォーマットのビデオを含むことができる。
システム700は、選択コンポーネント760を含むことができる。選択コンポーネント760は、テキスト情報に基づいて短編ビデオサーバから複数の短編ビデオを選択するための機能および命令を含むことができる。選択は、複数の短編ビデオの自動キュレーションを含む。選択は、実質的に類似したコンテンツ、実質的に異なるコンテンツ、などを含む短編ビデオを選択することを含み得る。選択は、ユーザのウェブページ挙動のアダプティブラーニングを含み得る。実施形態は、メタデータによってテキスト情報を拡張すること、およびメタデータに基づいて複数の短編ビデオの選択を実行することを含む。メタデータ、すなわち「データに関するデータ」は、時刻、曜日、または他の何らかの期間を含むことができる。メタデータは、ユーザに関する人口統計データの推測、ユーザプロファイルからのデータの取得、ウェブページ履歴の判定、などに基づくことができる。他の実施形態は、画像情報によってテキスト情報を拡張すること、および画像情報に基づいて複数の短編ビデオの選択を実行することを含む。画像情報は、それに広告、娯楽、または政治的メッセージが含まれているかどうか、といった画像コンテンツ情報を含むことができる。画像コンテンツは、都市か地方か、開発済みか未開発か、海か山か、イヌやネコといった動物か野生の生き物か、昼間か夜間か、などの環境情報を含むことができる。さらなる実施形態は、ウェブページから抽出されたテーマによってテキスト情報を拡張することを含み、その選択は、メタデータと短編ビデオテーマ情報との関連性のランク付けに基づく。ウェブページテーマは、ウェブページによって伝達される外観、スタイル、または「フィーリング」を含むことができる。テーマは、喜びまたは悲しみ、恐怖または意欲喚起、愉快または不快、などを含むことができる。所与のウェブページからのメタデータは、1つまたは複数の他のウェブページからのメタデータと比較すること、または関連付けることができる。
複数の短編ビデオの自動キュレーションは、短編ビデオを選択することによって達成することができる。短編ビデオの選択は、「台本」、所定のポリシー、広告キャンペーン、政治的メッセージ、などに基づいて行うことができる。実施形態では、自動キュレーションは、ニューラルネットワークによって、ウェブページに適した複数の短編ビデオのサブセットを選択することを含み得る。ニューラルネットワークは、短編ビデオの適切な選択を推論するため、適切な選択を予測するため、などに使用され得る。ニューラルネットワークは、畳み込みニューラルネットワーク、リカレントニューラルネットワーク、などを含むことができる。実施形態では、自動キュレーションは機械学習を含む。機械学習は、訓練データセットを用いてニューラルネットワークを訓練することを含むことができ、訓練データセットは、既知の良好なデータおよびデータに基づき予想される結果を含む。機械学習は、深層学習を含むことができ、教師なし学習、教師あり学習、などに基づくことができる。他の実施形態では、自動キュレーションは、ウェブページからのコンテキスト情報に基づいてサブセットを提供することができる。ウェブサイトからのコンテキスト情報は、ニュースウェブサイト、娯楽ウェブサイト、電子商取引ウェブサイト、などの種類のウェブサイトを含むことができる。実施形態では、コンテキスト情報は、ウェブページからのオーディオ情報の自然言語処理に基づいていてもよい。オーディオ情報は、ユーザが最初にウェブサイトを訪れたときに提供されるオーディオ情報、メニュー選択またはボタンクリックに基づいてウェブサイトを移動しているユーザから得られたオーディオ情報、などであり得る。さらなる実施形態では、コンテキスト情報は、ウェブページからのビデオ情報に基づいてもよい。ビデオ情報は、ウェブサイトから提供したり、ユーザが選択したりすることができる。他の実施形態では、自動キュレーションは、ウェブページにアクセスするユーザによる最近の挙動を追跡する長期短期記憶モデルに基づくことができる。長期短期記憶モデルは、リカレントニューラルネットワーク上に実装され得る。長期短期記憶モデルは、1つまたは複数の画像のような単一のデータポイント、オーディオまたはビデオのような一連のデータ、などを処理することができる。実施形態では、キュレーションは、ウェブページにアクセスするユーザによって時間的に重み付けされた挙動を使用する。時間的に重み付けされた挙動は、ウェブページ、ビデオ、オーディオなどに費やされる時間量を含むことができる。時間的に重み付けされた挙動は、ボタンクリックまたはメニュー選択の頻度、ボタンクリックまたはメニュー選択間の時間量などに基づくことができる。
システム700は、取り込みコンポーネント770を含むことができる。取り込みコンポーネント770は、短編ビデオサーバから取得した複数の短編ビデオを、ウェブページ上のフレームに取り込むための機能および命令を含むことができる。フレームは、水平方向、垂直方向、マトリックス構成などで構成され得る。実施形態では、短編ビデオを取り込んだフレームを既存のウェブページに追加して、関連する短編ビデオの表示を容易にすることができる。システム700は、表示コンポーネント780を含むことができる。表示コンポーネント780は、ウェブページ上のフレーム内に複数の短編ビデオの表現を表示するための機能および命令を含むことができる。表示表現は、ユーザによって構成されたウェブページの幅または高さに収まるように短編ビデオをサイズ変更することを含み得る。表示表現は、ユーザによって使用されているラップトップコンピュータ、タブレット、またはスマートフォンなどのデバイスに基づくことができる。実施形態は、フレーム内の複数の短編ビデオを自動再生することを含む。短編ビデオの自動再生は、短編ビデオの一部をループすること、ビデオ全体を再生すること、などを含むことができる。表示コンポーネント780は、没入型視聴体験を含むことができる。従来のビデオ視聴は、短編ビデオを表示するモバイルデバイスを単に凝視することを指すが、ビデオ視聴は、インタラクティブで参加型の体験に変換され得る。没入型視聴体験によって、ユーザがビデオを見ながら、ビデオの視聴に使用されるモバイルデバイスを回転、移動、傾斜させることが可能になる。結果として、そのような没入型視聴体験は、もはやパノラマ/全天球ビデオを使用して録画されたビデオ、またはVR(仮想現実)デバイスを使用して視聴されるビデオに限定されない。具体的には、良好な/スムーズな視聴体験とは、ビデオが固定されたままで(ユーザはビデオの外側を見ることができず、その結果、望ましくない部分的な黒い画面が生じる)、ユーザが必要なときだけズームインすることができ(ユーザが可能な限り多くのビデオを視聴できるようにするため)、安定した画面が提供され(回転時または傾斜時の激しい動きまたはスケーリングを回避するため)、スマートビューが提供され(ビデオの一部分の表示しか見えない場合、可能であればかなりの部分を見せる)、ビデオ品質が保証される(表示のあらゆる角度/傾斜において)こと、と定義される。
システム700は、ビデオ操作のためにコンピュータ可読媒体に具体化されたコンピュータプログラム製品を含むことができ、前記コンピュータプログラム製品は、1つまたは複数のプロセッサに以下の動作を行わせるコードを含んでおり、すなわち、ウェブページのコンテンツをロードする動作であって、前記コンテンツが複数の短編ビデオのためのフレームを含む、ロードする動作と、テキスト情報についてウェブページのコンテンツを分析する動作と、短編ビデオサーバにアクセスする動作と、前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択する動作であって、前記選択は、前記複数の短編ビデオを自動キュレーションすることを含む、選択する動作と、前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込む動作と、前記ウェブページ上の前記フレーム内に前記複数の短編ビデオの表現を表示する動作と、である。
上記の方法の各々は、1つまたは複数のコンピュータシステム上の1つまたは複数のプロセッサ上で実行され得る。実施形態は、様々な形態の分散コンピューティング、クライアント/サーバコンピューティング、およびクラウドベースのコンピューティングを含むことができる。さらに、本開示のフローチャートに含まれる図示されたステップまたはボックスは、単に例示的かつ説明的であることが理解されよう。ステップは、本開示の範囲から逸脱することなく修正、省略、反復、または並べ替えが行われてもよい。さらに、各ステップは、1つまたは複数のサブステップを含むことができる。前述の図面および説明は、開示されたシステムの機能的態様を記載しているが、明示的に述べられていない限り、または文脈から明らかでない限り、ソフトウェアおよび/またはハードウェアの特定の実装または配置は、これらの説明から推測されるべきではない。ソフトウェアおよび/またはハードウェアのすべてのそのような構成は、本開示の範囲内に含まれることが意図されている。
ブロック図およびフローチャート図は、方法、装置、システム、およびコンピュータプログラム製品を示す。ブロック図およびフロー図の要素および要素の組み合わせは、方法、装置、システム、コンピュータプログラム製品、および/またはコンピュータ実装方法、の機能またはステップまたはステップ群を示す。本明細書で一般に「回路」、「モジュール」、または「システム」と呼ばれるそのような機能のすべては、コンピュータプログラム命令、専用ハードウェアベースのコンピュータシステム、専用ハードウェアとコンピュータ命令の組み合わせ、汎用ハードウェアとコンピュータ命令の組み合わせ、などによって実装され得る。
上述のコンピュータプログラム製品またはコンピュータ実装方法のいずれかを実行するプログラマブル装置は、1つまたは複数のマイクロプロセッサ、マイクロコントローラ、組み込みマイクロコントローラ、プログラマブルデジタル信号プロセッサ、プログラマブルデバイス、プログラマブルゲートアレイ、プログラマブルアレイロジック、メモリデバイス、特定用途向け集積回路、などを含むことができる。各々は、コンピュータプログラム命令を処理し、コンピュータロジックを実行し、コンピュータデータを格納する、などのために適切に使用または構成され得る。
コンピュータは、コンピュータ可読ストレージ媒体からのコンピュータプログラム製品を含むことができ、この媒体は、内部もしくは外部、取り外し可能かつ交換可能、または固定され得ることが理解されよう。さらに、コンピュータは、ベーシックインプット/アウトプットシステム(BIOS)、ファームウェア、オペレーティングシステム、データベース、などを含み、これらは、本明細書に記載のソフトウェアおよびハードウェアを含むか、それとインターフェース接続するか、またはそれをサポートすることができる。
本発明の実施形態は、従来のコンピュータアプリケーションにも、それらを実行するプログラマブル装置にも、限定されない。例を挙げると、ここで特許請求される発明の実施形態は、光学コンピュータ、量子コンピュータ、アナログコンピュータなどを含むことができる。コンピュータプログラムをコンピュータにロードして、図示した機能のすべてを実行することができる特定のマシンを製造することができる。この特定のマシンは、図示した機能のすべてを実行するための手段を提供する。
1つまたは複数のコンピュータ可読媒体の任意の組み合わせは、限定はしないが、以下を含んで利用されてもよく、すなわち、ストレージ用の非一時的コンピュータ可読媒体、電子的、磁気的、光学的、電磁的、赤外線、もしくは半導体コンピュータ可読ストレージ媒体、もしくは上記の任意の適切な組み合わせ、携帯型コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM、フラッシュ、MRAM、FeRAM、または相変化メモリ)、光ファイバ、ポータブルコンパクトディスク、光学ストレージデバイス、磁気ストレージデバイス、または前述の任意の適切な組み合わせ、である。本明細書の文脈では、コンピュータ可読ストレージ媒体は、命令実行システム、装置、またはデバイスによる、またはそれに関連する、使用のためのプログラムを含み得るかまたは格納し得る任意の有形媒体であってもよい。
コンピュータプログラム命令は、コンピュータ実行可能コードを含み得ることが理解されよう。コンピュータプログラム命令を表現するための様々な言語は、限定はしないが、C、C++、Java、JavaScript(商標)、ActionScript(商標)、アセンブリ言語、Lisp、Perl、Tcl、Python、Ruby、ハードウェア記述言語、データベースプログラミング言語、機能プログラミング言語、命令プログラミング言語、などを含むことができる。実施形態では、コンピュータプログラム命令は、コンピュータ、プログラマブルデータ処理装置、プロセッサまたはプロセッサアーキテクチャの異種組み合わせ、などで実行されるように格納、コンパイル、または解釈され得る。限定するものではないが、本発明の実施形態は、ウェブベースのコンピュータソフトウェアの形態をとることができ、これには、クライアント/サーバソフトウェア、ソフトウェアアズアサービス、ピアツーピアソフトウェアなどが含まれる。
実施形態では、コンピュータは、複数のプログラムまたはスレッドを含む、コンピュータプログラム命令の実行を可能にすることができる。複数のプログラムまたはスレッドは、プロセッサの使用率を向上させるため、および実質的に同時に行われる機能を容易にするために、ほぼ同時に処理されてもよい。実装として、本明細書に記載されたすべての方法、プログラムコード、プログラム命令などは、1つまたは複数のスレッドで実装されてもよく、これによって次に他のスレッドを起動させることができ、他のスレッド自体はそれらに関連付けられた優先順位を有し得る。いくつかの実施形態では、コンピュータは、優先順位または他の順序に基づいてこれらのスレッドを処理することができる。
明確に述べられていない限り、または文脈から明らかでない限り、動詞「実行する」および「処理する」は、実行、処理、解釈、コンパイル、アセンブル、リンク、ロード、またはこれらの組み合わせを示すために交換可能に使用され得る。したがって、コンピュータプログラム命令、コンピュータ実行可能コードなどを実行または処理する実施形態は、記載された方法のすべてにおいて命令またはコードに従って対応し得る。さらに、示された方法ステップは、1つまたは複数の当事者または事業体にステップを実行させる任意の適切な方法を含むことを意図している。ステップまたはステップの一部を実行する当事者は、特定の地理的位置または国の境界内に位置する必要はない。例えば、米国内にある事業体が、方法ステップまたはその一部を米国外で実行させる場合、その方法は、因果関係のある事業体によって米国内で実行されると見なされる。
本発明は、詳細に示され説明された好ましい実施形態に関連して開示されているが、これらの様々な修正および改良が当業者には明らかになるであろう。したがって、前述の例は、本発明の趣旨および範囲を限定するものではなく、むしろ、それは法律によって許容される最も広い意味で理解されるべきである。

Claims (46)

  1. ビデオ操作のためのコンピュータ実装方法であって、
    ウェブページのコンテンツをロードすることであって、前記コンテンツには、複数の短編ビデオのフレームが含まれる、ロードすることと、
    テキスト情報について前記ウェブページの前記コンテンツを分析することと、
    短編ビデオサーバにアクセスすることと、
    前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択することであって、前記選択は前記複数の短編ビデオを自動キュレーションすることを含む、選択することと、
    前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込むことと、
    前記ウェブページ上の前記フレーム内に前記複数の短編ビデオの表現を表示することと、を含む方法。
  2. 前記自動キュレーションが、ニューラルネットワークによって、前記ウェブページに適した前記複数の短編ビデオのサブセットを選択することを含む、請求項1に記載の方法。
  3. 前記自動キュレーションが機械学習を含む、請求項2に記載の方法。
  4. 前記自動キュレーションが、前記ウェブページからのコンテキスト情報に基づいて前記ビデオのサブセットを提供する、請求項2に記載の方法。
  5. 前記コンテキスト情報が、前記ウェブページからのオーディオ情報の自然言語処理に基づいている、請求項4に記載の方法。
  6. 前記コンテキスト情報が、前記ウェブページからのビデオ情報に基づいている、請求項4に記載の方法。
  7. 前記自動キュレーションが、前記ウェブページにアクセスするユーザによる最近の挙動を追跡する長期短期記憶モデルに基づいている、請求項1に記載の方法。
  8. 前記キュレーションが、前記ウェブページにアクセスするユーザによって時間的に重み付けされた挙動を使用する、請求項1に記載の方法。
  9. 前記フレームが、既存のウェブページに追加されて、関連する短編ビデオの表示を容易にする、請求項1に記載の方法。
  10. 前記ウェブページ上の前記フレームが、前記短編ビデオサーバから前記複数の短編ビデオをプルする、請求項1に記載の方法。
  11. 前記テキスト情報をメタデータで拡張すること、および前記メタデータに基づいて前記複数の短編ビデオの前記選択を実行することをさらに含む、請求項1に記載の方法。
  12. 前記テキスト情報を画像情報によって拡張すること、および前記画像情報に基づいて前記複数の短編ビデオの前記選択を実行することをさらに含む、請求項11に記載の方法。
  13. 前記ウェブページから抽出されたテーマによって前記テキスト情報を拡張することをさらに含み、前記選択は、メタデータと短編ビデオテーマ情報との関連性のランク付けに基づく、請求項11に記載の方法。
  14. 前記フレーム内で前記複数の短編ビデオを自動再生することをさらに含む、請求項1に記載の方法。
  15. 前記ウェブページ上の前記フレーム内に埋め込まれたコールトゥアクションに対する応答を受信することをさらに含む、請求項1に記載の方法。
  16. 前記コールトゥアクションに対する応答に基づいて、前記短編ビデオサーバから第2の複数の短編ビデオを提供することをさらに含み、前記第2の複数の短編ビデオの基準によって、前記複数の短編ビデオの前記自動キュレーションが修正される、請求項15に記載の方法。
  17. 前記フレームが、前記複数の短編ビデオの表現を直線的に示す、請求項1に記載の方法。
  18. 前記フレームが、グリッド形式で前記複数の短編ビデオの表現を示す、請求項1に記載の方法。
  19. ユーザのウェブページ挙動に基づいて、前記選択のためにアダプティブラーニングを使用することをさらに含む、請求項1に記載の方法。
  20. 前記アダプティブラーニングが、前記選択の前の前記ユーザのウェブページ挙動を収集することを含む、請求項19に記載の方法。
  21. 前記アダプティブラーニングが、前記ウェブページ上の前記ユーザのスワイプおよび/またはクリックの収集を含む、請求項19に記載の方法。
  22. 前記アダプティブラーニングが、前記ウェブページに関連する複数のウェブページ上の前記ユーザのスワイプおよび/またはクリックの収集を含む、請求項21に記載の方法。
  23. 前記アダプティブラーニングが、他のユーザのウェブページ挙動の履歴パターンと前記ユーザのウェブページ挙動とを比較することを含む、請求項19に記載の方法。
  24. 前記アダプティブラーニングが、前記ユーザのウェブページ挙動と前記ウェブページからのコンテキスト情報と組み合わせる、請求項19に記載の方法。
  25. 前記アダプティブラーニングが、前記ユーザに関する人口統計データを含む、請求項19に記載の方法。
  26. 追加のウェブページ挙動を収集するために前記ユーザによるオプトインをさらに含む、請求項19に記載の方法。
  27. 前記追加のウェブページ挙動が、追加のウェブサイトでの前記ユーザのウェブページ挙動を監視することを含む、請求項26に記載の方法。
  28. オプトインに対して前記ユーザに報酬を与えることをさらに含む、請求項26に記載の方法。
  29. ビデオ操作のためのコンピュータ可読媒体に具現化されたコンピュータプログラム製品であって、前記コンピュータプログラム製品はコードを含み、このコードによって、1つまたは複数のプロセッサが、
    ウェブページのコンテンツをロードする動作であって、前記コンテンツには、複数の短編ビデオのフレームが含まれる、ロードする動作と、
    テキスト情報について前記ウェブページの前記コンテンツを分析する動作と、
    短編ビデオサーバにアクセスする動作と、
    前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択する動作であって、前記選択は前記複数の短編ビデオを自動キュレーションすることを含む、選択する動作と、
    前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込む動作と、
    前記ウェブページ上の前記フレーム内に前記複数の短編ビデオの表現を表示する動作と、を実行するコンピュータプログラム製品。
  30. 前記自動キュレーションが、ニューラルネットワークによって、前記ウェブページに適した前記複数の短編ビデオのサブセットを選択することを含む、請求項29に記載のコンピュータプログラム製品。
  31. 前記自動キュレーションが機械学習を含む、請求項30に記載のコンピュータプログラム製品。
  32. 前記自動キュレーションが、前記ウェブページからのコンテキスト情報に基づいてビデオの前記サブセットを提供する、請求項30に記載のコンピュータプログラム製品。
  33. 前記コンテキスト情報が、前記ウェブページからのオーディオ情報の自然言語処理に基づいている、請求項32に記載のコンピュータプログラム製品。
  34. 前記コンテキスト情報が、前記ウェブページからのビデオ情報に基づいている、請求項32に記載のコンピュータプログラム製品。
  35. 前記自動キュレーションが、前記ウェブページにアクセスするユーザによる最近の挙動を追跡する長期短期記憶モデルに基づいている、請求項29に記載のコンピュータプログラム製品。
  36. 前記キュレーションが、前記ウェブページにアクセスするユーザによって時間的に重み付けされた挙動を使用する、請求項29に記載のコンピュータプログラム製品。
  37. ユーザのウェブページ挙動に基づいて、前記選択のためにアダプティブラーニングを使用するためのコードをさらに含む、請求項29に記載のコンピュータプログラム製品。
  38. ビデオ操作のためのコンピュータシステムであって、
    命令を格納するメモリと、
    前記メモリに接続された1つまたは複数のプロセッサとを含み、前記1つまたは複数のプロセッサが、格納された前記命令を実行した場合、
    ウェブページのコンテンツをロードすることであって、前記コンテンツが、複数の短編ビデオのフレームを含む、ロードすることと、
    テキスト情報について前記ウェブページの前記コンテンツを分析することと、
    短編ビデオサーバにアクセスすることと、
    前記テキスト情報に基づいて前記短編ビデオサーバから複数の短編ビデオを選択することであって、前記選択が前記複数の短編ビデオを自動キュレーションすることを含む、選択することと、
    前記短編ビデオサーバから取得した前記複数の短編ビデオを前記ウェブページ上の前記フレームに取り込むことと、
    前記ウェブページ上の前記フレーム内に前記複数の短編ビデオの表現を表示することと、を行うように構成されたコンピュータシステム。
  39. 前記自動キュレーションが、ニューラルネットワークによって、前記ウェブページに適した前記複数の短編ビデオのサブセットを選択することを含む、請求項38に記載のコンピュータシステム。
  40. 前記自動キュレーションが機械学習を含む、請求項39に記載のコンピュータシステム。
  41. 前記自動キュレーションが、前記ウェブページからのコンテキスト情報に基づいてビデオの前記サブセットを提供する、請求項39に記載のコンピュータシステム。
  42. 前記コンテキスト情報が、前記ウェブページからのオーディオ情報の自然言語処理に基づいている、請求項41に記載のコンピュータシステム。
  43. 前記コンテキスト情報が、前記ウェブページからのビデオ情報に基づいている、請求項41に記載のコンピュータシステム。
  44. 前記自動キュレーションが、前記ウェブページにアクセスするユーザによる最近の挙動を追跡する長期短期記憶モデルに基づいている、請求項38に記載のコンピュータシステム。
  45. 前記キュレーションが、前記ウェブページにアクセスするユーザによって時間的に重み付けされた挙動を使用する、請求項38に記載のコンピュータシステム。
  46. ユーザのウェブページ挙動に基づいて、前記選択のためにアダプティブラーニングを使用するようさらに構成された、請求項38に記載のコンピュータシステム。
JP2022546657A 2020-02-05 2021-02-04 選択および表示のための機械学習によるビデオのキュレーション Pending JP2023513095A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062970364P 2020-02-05 2020-02-05
US62/970,364 2020-02-05
US202063086077P 2020-10-01 2020-10-01
US63/086,077 2020-10-01
PCT/US2021/016505 WO2021158719A1 (en) 2020-02-05 2021-02-04 Machine learned curating of videos for selection and display

Publications (1)

Publication Number Publication Date
JP2023513095A true JP2023513095A (ja) 2023-03-30

Family

ID=77062130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022546657A Pending JP2023513095A (ja) 2020-02-05 2021-02-04 選択および表示のための機械学習によるビデオのキュレーション

Country Status (5)

Country Link
US (1) US11880423B2 (ja)
EP (1) EP4101176A4 (ja)
JP (1) JP2023513095A (ja)
CN (1) CN115152242A (ja)
WO (1) WO2021158719A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11381853B1 (en) * 2021-01-28 2022-07-05 Meta Platforms, Inc. Systems and methods for generating and distributing content for consumption surfaces
WO2024081178A1 (en) * 2022-10-10 2024-04-18 Loop Now Technologies, Inc. Dynamic population of contextually relevant videos in an ecommerce environment

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3069414A (en) 1961-06-09 1962-12-18 Ruggieri Pietro De 3-hydrazone steroids of the androstane and estrane series and derivatives thereof
US8069414B2 (en) 2007-07-18 2011-11-29 Google Inc. Embedded video player
US9824372B1 (en) 2008-02-11 2017-11-21 Google Llc Associating advertisements with videos
US8504426B2 (en) * 2008-05-08 2013-08-06 Ingenio Llc Systems and methods to connect people via videos for real time communications
KR20100070060A (ko) 2008-12-17 2010-06-25 삼성전자주식회사 촬상 장치, 촬상 방법 및 프로그램
US8244707B2 (en) 2010-01-15 2012-08-14 Hulu Llc Method and apparatus for providing supplemental video content for third party websites
US8918330B1 (en) 2010-01-20 2014-12-23 Google Inc. Display of videos based on referrers
MX2012009888A (es) 2010-02-24 2012-09-12 Thomson Licensing Subtitulado para imagenes estereoscopicas.
US9076041B2 (en) * 2010-08-26 2015-07-07 Blast Motion Inc. Motion event recognition and video synchronization system and method
US9118712B2 (en) 2010-12-30 2015-08-25 Everis, Inc. Network communication system with improved security
US8533754B2 (en) 2011-06-03 2013-09-10 Limelight Networks, Inc. Embedded video player with modular ad processing
US20130246141A1 (en) 2011-06-22 2013-09-19 Michael A. Liberty Disruptively priced or free financial services or items in exchange for participation in opt in advertising
AU2011204946C1 (en) 2011-07-22 2012-07-26 Microsoft Technology Licensing, Llc Automatic text scrolling on a head-mounted display
US9569097B2 (en) 2011-12-01 2017-02-14 Microsoft Technology Licesing, LLC Video streaming in a web browser
US8682809B2 (en) 2012-04-18 2014-03-25 Scorpcast, Llc System and methods for providing user generated video reviews
US9237367B2 (en) 2013-01-28 2016-01-12 Rhythmone, Llc Interactive video advertisement in a mobile browser
US20150195175A1 (en) 2014-01-06 2015-07-09 Safe Frontier Llc Method and apparatus for providing remote support for an embedded system
US20150213516A1 (en) 2014-01-25 2015-07-30 Leo Jeremias Computer system for displaying video ads on web pages
US9710546B2 (en) * 2014-03-28 2017-07-18 Microsoft Technology Licensing, Llc Explicit signals personalized search
US9984505B2 (en) 2014-09-30 2018-05-29 Sony Interactive Entertainment Inc. Display of text information on a head-mounted display
CN104731959B (zh) * 2015-04-03 2017-10-17 北京威扬科技有限公司 基于文本的网页内容生成视频摘要的方法、装置及系统
EP3284261A4 (en) * 2015-04-16 2018-09-26 W.S.C. Sports Technologies Ltd. System and method for creating and distributing multimedia content
US20170109584A1 (en) * 2015-10-20 2017-04-20 Microsoft Technology Licensing, Llc Video Highlight Detection with Pairwise Deep Ranking
KR101606860B1 (ko) 2015-11-23 2016-03-28 (주)아바엔터테인먼트 파노라마 동영상의 화면 표시정보 디스플레이 방법 및 이를 이용한 모바일 단말 및 전방위 가상현실 제공 시스템
US10033686B2 (en) 2016-05-23 2018-07-24 Oath Inc. Computerized system and method for automatically creating and communicating media streams of digital content
US10664157B2 (en) 2016-08-03 2020-05-26 Google Llc Image search query predictions by a keyboard
US10642893B2 (en) 2016-09-05 2020-05-05 Google Llc Generating theme-based videos
US9785717B1 (en) 2016-09-29 2017-10-10 International Business Machines Corporation Intent based search result interaction
US10958890B2 (en) 2017-03-31 2021-03-23 Samsung Electronics Co., Ltd. Method and apparatus for rendering timed text and graphics in virtual reality video
US20190286676A1 (en) 2018-03-16 2019-09-19 Turbine Corporate Holdings, Inc. Contextual content collection, filtering, enrichment, curation and distribution
US11093644B2 (en) * 2019-05-14 2021-08-17 Google Llc Automatically detecting unauthorized re-identification
US11281717B2 (en) * 2019-09-23 2022-03-22 Adobe Inc. Customized selection of video thumbnails to present on social media webpages
US11636313B2 (en) * 2019-12-03 2023-04-25 Sap Se Recommendation system based on neural network models to improve efficiencies in interacting with e-commerce platforms

Also Published As

Publication number Publication date
EP4101176A1 (en) 2022-12-14
US11880423B2 (en) 2024-01-23
US20210240794A1 (en) 2021-08-05
WO2021158719A1 (en) 2021-08-12
EP4101176A4 (en) 2024-02-07
CN115152242A (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN110781321B (zh) 一种多媒体内容推荐方法及装置
JP6276344B2 (ja) 動画コンテンツのハイライト映像を抽出して提供する方法およびシステム
US20190174191A1 (en) System and Method for Integrating Interactive Call-To-Action, Contextual Applications with Videos
Fu et al. Aggregate bandwagon effect on online videos' viewership: Value uncertainty, popularity cues, and heuristics
US9002895B2 (en) Systems and methods for providing modular configurable creative units for delivery via intext advertising
CN104782138B (zh) 缩略图图像选择系统、方法及计算机可读介质
CN107430630A (zh) 用于聚集和呈现与特定视频游戏相关的内容的方法、系统和介质
AU2016423749A1 (en) Video keyframes display on online social networks
CN107852399A (zh) 流媒体呈现系统
CN111818370B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
US9350817B2 (en) Recording a hyper text transfer protocol (HTTP) session for playback
TW201441851A (zh) 網頁顯示時間
US20160227277A1 (en) Method and system for determining viewers' video clip attention and placing commercial responsive thereto
US11880423B2 (en) Machine learned curating of videos for selection and display
CN112040339A (zh) 一种视频数据的制作方法、装置、计算机设备和存储介质
CN116821475A (zh) 基于客户数据的视频推荐方法、装置及计算机设备
Yoon et al. What content and context factors lead to selection of a video clip? The heuristic route perspective
CN112533050A (zh) 一种视频处理方法、装置、设备及介质
US20220394345A1 (en) Frame and child frame for video and webpage rendering
US11175807B1 (en) Intelligent contextual video thumbnail display
EP3296890A1 (en) Video keyframes display on online social networks
US20220317866A1 (en) Inline frame based video rendering within browser
JP2024514484A (ja) ブラウザ内のインラインフレームベースの動画のレンダリング
JP2009211195A (ja) 情報システム、情報端末、情報通信方法
CN111914177B (zh) 媒体信息兴趣度的匹配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221006

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240126