JP2022548331A - 人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ - Google Patents

人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ Download PDF

Info

Publication number
JP2022548331A
JP2022548331A JP2022518936A JP2022518936A JP2022548331A JP 2022548331 A JP2022548331 A JP 2022548331A JP 2022518936 A JP2022518936 A JP 2022518936A JP 2022518936 A JP2022518936 A JP 2022518936A JP 2022548331 A JP2022548331 A JP 2022548331A
Authority
JP
Japan
Prior art keywords
game
interest
narration
audience
spectator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022518936A
Other languages
English (en)
Other versions
JP7320672B2 (ja
Inventor
マッコイ チャールズ
ション トゥルー
ブレイン モーガン ネイサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2022548331A publication Critical patent/JP2022548331A/ja
Application granted granted Critical
Publication of JP7320672B2 publication Critical patent/JP7320672B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/52Controlling the output signals based on the game progress involving aspects of the displayed game scene
    • A63F13/525Changing parameters of virtual cameras
    • A63F13/5258Changing parameters of virtual cameras by dynamically adapting the position of the virtual camera to keep a game object or game character in its viewing frustum, e.g. for tracking a character or a ball
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4781Games
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • A63F13/35Details of game servers
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/30Interconnection arrangements between game servers and game devices; Interconnection arrangements between game devices; Interconnection arrangements between game servers
    • A63F13/35Details of game servers
    • A63F13/355Performing operations on behalf of clients with restricted processing capabilities, e.g. servers transform changing game scene into an encoded video stream for transmitting to a mobile phone or a thin client
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/52Controlling the output signals based on the game progress involving aspects of the displayed game scene
    • A63F13/525Changing parameters of virtual cameras
    • A63F13/5252Changing parameters of virtual cameras using two or more virtual cameras concurrently or sequentially, e.g. automatically switching between fixed virtual cameras when a character changes room or displaying a rear-mirror view in a car-driving game
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/53Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game
    • A63F13/537Controlling the output signals based on the game progress involving additional visual information provided to the game scene, e.g. by overlay to simulate a head-up display [HUD] or displaying a laser sight in a shooting game using indicators, e.g. showing the condition of a game character on screen
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/54Controlling the output signals based on the game progress involving acoustic signals, e.g. for simulating revolutions per minute [RPM] dependent engine sounds in a driving game or reverberation against a virtual wall
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/67Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/85Providing additional services to players
    • A63F13/86Watching games played by other players
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/50Controlling the output signals based on the game progress
    • A63F13/52Controlling the output signals based on the game progress involving aspects of the displayed game scene
    • A63F13/525Changing parameters of virtual cameras
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/55Controlling game characters or game objects based on the game progress
    • A63F13/58Controlling game characters or game objects based on the game progress by computing conditions of game characters, e.g. stamina, strength, motivation or energy level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Acoustics & Sound (AREA)
  • Optics & Photonics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

ビデオゲームのゲームセッションに参加しているプレイヤのゲーム状態データ及びユーザデータを受信することを含むブロードキャストを生成するための方法。ゲームセッションの観客関心ゾーンは、仮想ゲーム世界のカメラパースペクティブから見ることができる仮想ゲーム世界のシーンを有していると識別される。統計及びファクトは、ゲーム状態データとユーザデータに基づいて観客が関心のあるゲーム状態データとユーザデータを分離するようにトレーニングされた第1のAIモデルを使用して、ゲームセッションに対して生成される。ナレーションは、第1のAIモデルを使用して生成された統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、シーンに対して生成され、選択された統計及びファクトには、選択された統計及びファクトを使用してナレーションを生成するように構成された第2のAIモデルによって決定される最高の潜在的な観客の関心がある。【選択図】図3D

Description

本開示は、ビデオゲームまたはゲームアプリケーションに関する。とりわけ、本開示は、ビデオゲームのゲームセッションのシーンの1つまたは複数のビューを選択及び/または生成し、1人または複数の観客にストリーミングするための1つまたは複数のビューのブロードキャストを生成するための方法及びシステムを説明する。
ビデオゲームストリーミングは人気を集めている。観客は、プロのゲーマーを呼び物とした注目のイベントならびに、ゲームプレイを投稿する通常のゲーマーの両方にアクセスできる。観客は、ゲームセッションのライブストリーミングだけでなく、以前のゲームセッションのストリームにもアクセスできる。
人気のあるイベントの制作には、対応するゲームセッションのプレイごとにプレイを提供するプロのブロードキャスタが含まれる。例えば、イベントのプロのブロードキャスタには、ゲームセッションの複数のフィードとゲームセッションに関連する様々なファクトが提供される。フィードは、ゲームセッションで1人または複数のプレイヤのために生成されたゲームのビューから取得できる。ファクトは、実行中のゲームによって、またはプレイヤ及び/またはゲームセッションに関する興味深いファクトを絶えず検索している人間のアシスタントによって明らかになる可能性がある。ゲームセッションの複数のフィードは、ゲームセッションの異なるプレイヤに向けることができる。プロのブロードキャスタは、どのフィードをいつ表示するかを選択し、ゲームセッションに関連するファクトを使用して解説を提供することができる。このように、これらのライブイベントの観客は、ショーをさらに見ていてエキサイティングなものにするブロードキャスタとともに、ゲームセッションへの興味深く最高の視点を含む、プロの制作したショーを体験する。
観客は、通常のゲーマーのゲームセッションのストリーミングを楽しむこともできる。これらのストリームの一部にはナレーションが含まれておらず、プレイヤの画面に表示されるゲームセッションのビューのみが含まれている場合がある。ゲームセッションの他のストリームには、プレイヤがゲームアプリケーションをプレイしている間にプレイヤによって提供される解説などの、解説が含まれる場合がある。ある意味で、プレイヤはゲームセッション中に実行中の解説を提供している。しかしながら、通常のゲーマーのゲームセッションのストリームの人気は限定される可能性がある。
例えば、これらのストリームの観客は、解説が含まれていないゲームセッションを見るのに飽きたり、解説が提供されていないストリームを避けたりする場合がある。加えて、これらのストリームの観客は、プレイヤが自分のゲームプレイにのみ焦点を合わせているため、ゲームセッションのプレイヤによって提供される実行中の解説に飽きる可能性もある。観客は、ゲームセッションの他のプレイヤについて聞きたい、またはコメントしているプレイヤが気付いていないゲームセッションに関する他の洞察を聞きたいと思うかもしれない。
例えば、観客は、スポーツの生中継またはゲームイベントのプロのブロードキャスタによって提供されるものなど、ゲームセッションの背景情報を望む場合がある。または、観客は、他のプレイヤのゲームプレイを示すシーンと、そのシーンに対応する興味深いファクトを併せて見たいと思うかもしれない。基本的に、観客は、通常のゲーマーのゲームセッションのストリーミングのためにプロの人間のブロードキャスタを望んでいるが、これはロジスティック及び経済的に非現実的である。
本開示の実施形態が生じるのは、このような状況においてである。
本開示の実施形態は、人工知能(AI)によるゲームアプリケーションのシーンの1つまたは複数のレンダリングの生成に関し、さらに、AIによるゲームアプリケーションのシーンのナレーションの生成及び/またはシーンのレンダリングに関する。
一実施形態では、ゲームのビューを生成する方法が開示される。本方法は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。本方法は、ゲームセッションにおいて観客関心ゾーンを識別することを含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。本方法は、対応する観客関心ゾーンの対応するシーンの1つまたは複数の対応するカメラパースペクティブを生成するようにトレーニングされた第1のAIモデルに基づいて、観客関心ゾーンの第1のカメラパースペクティブを識別することを含む。
別の実施形態では、ゲームのビューを生成するためのコンピュータプログラムを格納する非一時的コンピュータ可読媒体が開示される。本コンピュータ可読媒体は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信するためのプログラム命令を含む。本コンピュータ可読媒体は、ゲームセッションにおいて観客関心ゾーンを識別するためのプログラム命令を含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。本コンピュータ可読媒体は、対応する観客関心ゾーンの対応するシーンの1つまたは複数の対応するカメラパースペクティブを生成するようにトレーニングされた第1のAIモデルに基づいて、観客関心ゾーンの第1のカメラパースペクティブを識別するためのプログラム命令を含む。
さらに別の実施形態では、コンピュータシステムが開示され、本コンピュータシステムは、プロセッサとメモリとを含み、メモリは、プロセッサに結合されており、コンピュータシステムによって実行されると、コンピュータシステムに、ゲームのビューを生成する方法を実行させる命令を、その中に格納している。本方法は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。本方法は、ゲームセッションにおいて観客関心ゾーンを識別することを含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。本方法は、対応する観客関心ゾーンの対応するシーンの1つまたは複数の対応するカメラパースペクティブを生成するようにトレーニングされた第1のAIモデルに基づいて、観客関心ゾーンの第1のカメラパースペクティブを識別することを含む。
別の実施形態では、ブロードキャストを生成するための方法が開示される。本方法は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。本方法は、ゲームセッションにおいて観客関心ゾーンを識別することを含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。本方法は、ゲーム状態データとユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1のAIモデルを使用して、ゲームセッションの統計及びファクトを生成することを含む。本方法は、第1のAIモデルを使用して生成された統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、観客関心ゾーンのシーンのナレーションを生成することを含み、選択された統計及びファクトには、第2のAIモデルによって決定される最高の潜在的な観客の関心があり、第2のAIモデルは、選択された統計及びファクトを使用してナレーションを生成するように構成されている。
別の実施形態では、ブロードキャストを生成するためのコンピュータプログラムを格納する非一時的コンピュータ可読媒体が開示される。本コンピュータ可読媒体は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信するためのプログラム命令を含む。本コンピュータ可読媒体は、ゲームセッションにおいて観客関心ゾーンを識別するためのプログラム命令を含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。
本コンピュータ可読媒体は、ゲーム状態データとユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1のAIモデルを使用して、ゲームセッションの統計及びファクトを生成するためのプログラム命令を含む。本コンピュータ可読媒体は、第1のAIモデルを使用して生成された統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、観客関心ゾーンのシーンのナレーションを生成するためのプログラム命令を含み、選択された統計及びファクトには、第2のAIモデルによって決定される最高の潜在的な観客の関心があり、第2のAIモデルは、選択された統計及びファクトを使用してナレーションを生成するように構成されている。
さらに別の実施形態では、コンピュータシステムが開示され、本コンピュータシステムは、プロセッサとメモリとを含み、メモリは、プロセッサに結合されており、コンピュータシステムによって実行されると、コンピュータシステムに、ブロードキャストを生成する方法を実行させる命令を、その中に格納している。本方法は、1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。
本方法は、ゲームセッションにおいて観客関心ゾーンを識別することを含み、観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができるビデオゲームの仮想ゲーム世界のシーンを有する。本方法は、ゲーム状態データとユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1のAIモデルを使用して、ゲームセッションの統計及びファクトを生成することを含む。
本方法は、第1のAIモデルを使用して生成された統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、観客関心ゾーンのシーンのナレーションを生成することを含み、選択された統計及びファクトには、第2のAIモデルによって決定される最高の潜在的な観客の関心があり、第2のAIモデルは、選択された統計及びファクトを使用してナレーションを生成するように構成されている。
本開示の他の態様は、本開示の原理の例として示される添付図面と併せて、下記の発明を実施するための形態から明らかになるであろう。
本開示は、添付図面と併せて、以下の詳細な説明を参照することにより、最も良く理解することができる。
本開示の一実施形態による、ビデオゲームのゲームセッションにおけるシーンのカメラパースペクティブのAI制御された生成、ならびにシーン及び/またはシーンのカメラパースペクティブのナレーションのAI制御された生成に使用されるシステムを示す。 本開示の一実施形態による、AIカメラパースペクティブ及びAIナレーションモデルを含む、人工知能(AI)モデルを構築するのに使用される例示的なニューラルネットワークを示す。 本開示の一実施形態による、1つまたは複数のゲームセッションにおいて、対応するユーザに対してローカルで、またはバックエンドクラウドゲームサーバで実行されている1つまたは複数のゲームアプリケーションをプレイする1人または複数のユーザにゲーム制御を提供するシステムを示し、ゲームセッションはAIによってカメラパースペクティブモデルとナレーションモデルをトレーニングするために使用され、AIモデルは、ゲームセッションのシーンの関心のあるカメラパースペクティブを識別し、観客が対話する可能性が最も高いそれらのゲームセッションのそれらのシーンに対してナレーションを提供するために使用される。 本開示の実施形態による、複数のゲームアプリケーションの複数のゲームセッションにおいて観客関心ゾーンを識別し、それらの識別された観客関心ゾーンの関心があるカメラパースペクティブを識別し、それらの識別された観客関心ゾーンのシーンに対するナレーションを提供することができるAIモデルを、トレーニングするように構成されたシステムを示す。 本開示の一実施形態による、観客にとって関心がある可能性のある観客関心ゾーンを識別するために使用される観客関心ゾーンモデルを、AIによってトレーニングするために使用されるシステムを示す。 本開示の一実施形態による、関心ゾーンAIモデルによって以前に観客にとって関心があるものとして識別された関心ゾーンのシーンのカメラパースペクティブを識別するように構成できるAIカメラパースペクティブモデルによってトレーニングするためのシステムであって、識別されたカメラパースペクティブはまた、観客にとって関心があるものとして識別されている、システムを示す。 本開示の一実施形態による、関心ゾーンAIモデルによって観客にとって関心があるものとして以前に識別された関心ゾーンのシーンのナレーションを生成するように構成することができるAIブロードキャスト/ナレーションモデルを使用してトレーニングするためのシステムであって、ナレーションは、AIカメラパースペクティブモデルによって識別されるカメラパースペクティブに合わせて調整することができる、システムを示す。 本開示の一実施形態による、ゲームアプリケーションのゲームセッションのカメラパースペクティブ及び関心ゾーンを選択するように構成されたユーザインタフェースであって、関心ゾーンAIモデルによって観客にとって関心があると識別された1つまたは複数の観客関心ゾーンと、それらの識別された観客関心ゾーンに対する1つまたは複数の生成されたカメラパースペクティブとを含み、カメラパースペクティブはAIカメラパースペクティブモデルを使用して観客にとって関心があるものとして識別されている、ユーザインタフェースを示す。 本開示の一実施形態による、1つまたは複数のAIモデルを使用して観客にとって関心がある可能性のある観客関心ゾーンのカメラパースペクティブを識別するための方法のステップを示す流れ図である。 本開示の一実施形態による、AIモデルを使用して観客にとって関心があると識別された観客関心ゾーンのシーンのナレーションを構築及び/または生成するための方法のステップを示す流れ図であり、ナレーションは、AIモデルを使用して識別されたシーンの1つまたは複数のカメラパースペクティブに合わせて調整することができる。 本開示の実施形態による、ゲームアプリケーションをプレイする1人または複数のプレイヤを含むゲームセッションのハイライトリールの生成を示し、ハイライトリールは、複数のゲームアプリケーションの複数のゲームセッションにおける観客関心ゾーンを識別できるAIモデルを使用して生成されて、それらの識別された観客関心ゾーンの関心があるカメラパースペクティブを識別し、それらの識別された観客関心ゾーンのシーンに対するナレーションを提供する。 本開示の様々な実施形態の態様を実行するために使用することができる例示的なデバイスの構成要素を示す。
以下の詳細な説明は、例示の目的で多くの特定の詳細を含むが、当業者であれば、以下の詳細に対する多くの変形及び変更が本開示の範囲内にあることを理解するであろう。したがって、以下で説明される本開示の態様は、この説明に続く特許請求の範囲への一般性を失うことなく、また限定を課すことなく示される。
一般的に言えば、本開示の様々な実施形態は、人工知能(AI)によるゲームアプリケーションのシーンの1つまたは複数のレンダリングの生成を説明するものであり、さらに、AIによるゲームアプリケーションのシーンのナレーションの生成及び/またはシーンのレンダリングに関する。いくつかの実施形態では、ゲームの1つまたは複数のレンダリングは、人工知能(AI)によって生成される。AIは、カメラアングルを制御して最も関心のあるアクションをキャプチャし、アングル間をカットして、単一のビューに収まらないアクションを組み込み、様々な視点からアクションを表示できる。AIは、ゲームの多くの側面とプレイヤの関心を考慮に入れて、視聴者にとって最も関心があるアクションを決定できる。観客ごとに異なるストリームを生成できる。
AIは、ストリームにアクションのリプレイを含めることができるため、観客は異なる視点からエキサイティングなアクションを再び見ることができ、ゲームのライブカメラビューでは発生しなかったアクションを見ることができる。AIはカメラアングルを選択して、狙撃兵と狙撃兵が狙っているターゲットの両方を示すアングルなど、疑わしいアクションの全体ビューを含めることができる。AIは、それが生成するゲームストリームに解説を追加できる。いくつかの実施形態では、AI解説は、説得力のある個性を有する。解説は、AIが選択したビューが重要であるとAIが考えた理由を観客に伝えることができる。
例えば、AIが新しいプレイヤが経験豊富なプレイヤをキルする位置にあることに気付いた場合、AIはそのファクトを指摘し、新しいプレイヤが実際に状況を利用してより経験豊富なプレイヤをキルすることができるかどうかを観客に見せることができる。いくつかの実施態様では、解説を提供するAIボイスオーバーにより、eスポーツゲームのアクションを説明できるため、視覚障害のある観客にとって理解可能でエキサイティングなものになる。いくつかの実施形態では、解説を提供するAIは、複数の場所の視聴者にローカライズされた(すなわち、地方及び/または地域の慣習を考慮した)解説を含むストリームを生成し、異なる言語(手話を含む)の解説を含み得る。いくつかの実施形態では、ハイライトカバレッジは、ハイライトリールの生成においてなど、ゲームが終了した後に利用可能である。
このようなカバレッジは、AIの選択に基づいて自動的に生成できる。そのようなカバレッジは、観客がライブゲームプレイを見ているときに見るか巻き戻すことを選択したかに基づくことができる。さらに他の実施形態では、ゲームのカバレッジは、プレイエリアのマップを見る能力を含み得る。このようなマップには、まだゲーム内に残っている全てのプレイヤの場所やプレイヤの排除の場所などのメタデータを含めることができる。マップビューでプレイヤの排除をハイライトすることができる1つの方法は、排除が行われた場所で真っ赤なドットを点滅させることによるものである。
本明細書全体を通して、「ビデオゲーム」または「ゲームアプリケーション」への参照は、入力コマンドの実行を通して指示されるいずれかのタイプのインタラクティブアプリケーションを表現することを意味する。例示のみを目的として、インタラクティブアプリケーションは、ゲーミング、文書処理、ビデオゲーム処理などのためのアプリケーションを含む。さらに、ビデオゲーム及びゲーミングアプリケーションという用語は、交換可能である。
様々な実施形態の上記の一般的な理解により、様々な図面を参照して実施形態の例の詳細をここに説明する。
図1Aは、本開示の一実施形態による、ビデオゲームのゲームセッションにおけるシーンのカメラパースペクティブのAI制御された生成、ならびにシーン及び/またはシーンのカメラパースペクティブのナレーションのAI制御された生成に使用されるシステム10を示す。システム10はまた、ゲームセッションでシーンのカメラパースペクティブを生成するために、及びそのシーンのナレーション及び/またはそのシーンのカメラパースペクティブを生成するために使用されるAIモデルをトレーニングするように構成され得る。
図1Aに示されるように、ビデオゲーム(例えば、ゲームロジック177)は、ユーザ5のクライアントデバイス100においてローカルに実行することができ、またはビデオゲーム(例えば、ゲームロジック277)は、クラウドゲームネットワークもしくはゲームクラウドシステムのバックエンドゲームサーバ205において動作するバックエンドゲーム実行エンジン211において実行することができる。ゲーム実行エンジン211は、ゲームサーバ205の多くのゲームプロセッサ201のうちの1つの中で動作することができる。さらに、ビデオゲームは、シングルプレイヤモードまたはマルチプレイヤモードで実行され得るものであり、本発明の実施形態は、両動作モードに対しマルチプレイヤ機能の強化(例えば支援、通信、ゲームスライス生成など)を提供する。
いずれの場合も、クラウドゲームネットワークは、人工知能(AI)によってビデオゲームのシーンの1つまたは複数のレンダリングを生成し、AIによるシーンのナレーション及び/またはビデオゲームのシーンのレンダリングを生成するように構成されている。より具体的には、システム10のクラウドゲームネットワークは、識別されたカメラパースペクティブを通してキャプチャされたシーンの1つまたは複数のレンダリングを生成するために使用される1つまたは複数のAIモデルを構築するため、ならびにシーン及び/または識別されたカメラパースペクティブに対するナレーションを生成するために構成することができる。
いくつかの実施形態では、クラウドゲームネットワーク210は、ホストマシンのハイパーバイザ上で作動する複数の仮想マシン(VM)を含み得るもので、1つまたは複数の仮想マシンは、シングルプレイヤまたはマルチプレイヤのビデオゲームをサポートする際、ホストのハイパーバイザが使用可能なハードウェアリソースを利用して、ゲームプロセッサモジュール201を実行するように構成される。別の実施形態では、クラウドゲームネットワーク210は、複数のユーザをサポートする複数のローカルコンピューティングデバイスをサポートするように構成され、各ローカルコンピューティングデバイスは、シングルプレイヤまたはマルチプレイヤのビデオゲーム内などのビデオゲームのインスタンスを実行し得る。
例えば、マルチプレイヤモードで、ビデオゲームがローカルで実行されている間、同時にクラウドゲームネットワークは、各ローカルコンピューティングデバイスから情報(例えばゲーム状態データ)を受信し、その情報をローカルコンピューティングデバイスのうちの1つまたは複数にわたり適宜配布し、これにより、各ユーザは、マルチプレイヤビデオゲームのゲーム環境内で他のユーザとインタラクトすることができる(例えばビデオゲーム内の該当キャラクタを通して)。このようにして、クラウドゲームネットワークは、マルチプレイヤゲーム環境内のユーザそれぞれのゲームプレイを調整し、組み合わせる。
示されるように、システム10は、複数のインタラクティブビデオゲームへのアクセスを提供するゲームプロセッサ201を実行するゲームサーバ205を含む。ゲームサーバ205は、クラウド内で利用可能な任意の種類のサーバコンピューティングデバイスであり得るもので、前述のような1つまたは複数のホスト上で実行される1つまたは複数の仮想マシンとして構成され得る。例えば、ゲームサーバ205は、ゲームプロセッサ201をサポートする仮想マシンを管理し得る。またゲームサーバ205は、ユーザ5への追加のサービス及び/またはコンテンツを提供するように構成される。
クライアントデバイス100は、インターネットなどのネットワーク150を介してビデオゲームへのアクセスを要求するように、ならびに、ゲームサーバ205により実行され、ユーザ5に対応付けられたディスプレイデバイス12に配信されるビデオゲームまたはゲームアプリケーションのインスタンスをレンダリングするように、構成される。例えば、ユーザ5は、クライアントデバイス100を介して、ゲームプロセッサ201上で実行されるビデオゲームのインスタンスとインタラクションを行い得る。
クライアントデバイス100はまた、前述のように、ビデオゲームをローカルで実行するように構成されたゲーム実行エンジン111を含み得る。クライアントデバイス100は、ゲームコントローラ6、タブレットコンピュータ11、キーボードなどの様々な種類の入力デバイスからの入力、及びビデオカメラ、マウス、タッチパッドなどにより取り込まれたジェスチャを、受信し得る。
クライアントデバイス100は、メモリとプロセッサモジュールとを少なくとも有する任意の種類のコンピューティングデバイスであり得るもので、ネットワーク150を介してゲームサーバ205に接続することができる。クライアントデバイス100のいくつかの例は、ビデオゲームのインスタンスを実行するためにゲームサーバ205とインタラクトすることが可能である、パーソナルコンピュータ(PC)、ゲームコンソール、ホームシアターデバイス、汎用コンピュータ、モバイルコンピューティングデバイス、タブレット、電話、またはいずれかの他のタイプのコンピューティングデバイスを含む。
ビデオゲームのゲームロジックは、ゲームエンジンまたはゲームタイトル処理エンジンに基づいて構築されている。ゲームエンジンには、ビデオゲームのゲーム環境を構築するためにゲームロジックで使用できるコア機能が含まれている。例えば、ゲームエンジンの一部の機能には、ゲーム環境内のオブジェクトに対する物理的な力と衝突をシミュレートするための物理エンジン、2Dまたは3Dグラフィックス用のレンダリングエンジン、衝突検出、サウンド、アニメーション、人工知能、ネットワーキング、ストリーミングなどが含まれ得る。
このようにして、ゲームロジックは、ゲームエンジンによって提供されるコア機能を最初から構築する必要はない。クライアントのローカルまたはクラウドゲームサーバのいずれかで、ゲームエンジンと組み合わせたゲームロジックはCPU及びGPUによって実行され、CPU及びGPUは高速処理ユニット(APU)内で構成できる。すなわち、共有メモリとともにCPU及びGPUは、ゲームレンダリングされたビデオフレームを生成するためのレンダリングパイプラインとして構成され得るものであり、その結果レンダリングパイプラインは、ターゲットとなる、及び/または仮想化されたディスプレイの各ピクセルに対して対応する色情報を含む、表示に適したビデオまたは画像フレームとしてゲームレンダリングされた画像を出力する。
ネットワーク150は、1つまたは複数の世代のネットワークトポロジを含み得る。新しいトポロジがオンラインになると、レンダリングされた画像やメディアの解像度をさらに高めるために、帯域幅が増加する。例えば、デジタルセルラーネットワークを介してブロードバンドアクセスを提供する5Gネットワーク(第5世代)は、4G LTEモバイルネットワークに取って代わる。5Gワイヤレスデバイスは、ローカルアンテナを介してローカルセルに接続する。次に、これらのアンテナは、高帯域幅接続(例えば、光ファイバーなど)によって電話網とインターネットに接続される。5Gネットワークは、より高速でより良いサービス品質で動作することが期待される。そのため、ビデオゲームに関連するこれらのより新しいネットワークトポロジを介して、ビデオフレーム及び/またはメディアのより高い解像度を提供することができる。
クライアントデバイス100は、レンダリングされた画像を受信するように、及びレンダリングされた画像をディスプレイ12に表示するように、構成されている。例えば、クラウドベースのサービスを通して、レンダリングされた画像は、ユーザ5に対応付けられたゲームサーバ205のゲーム実行エンジン211上で実行されるビデオゲームのインスタンスにより配信され得る。別の例では、ローカルゲーム処理を通して、レンダリングされた画像は、(例えば、ゲームプレイのため、または観戦のために)ローカルゲーム実行エンジン111により配信され得る。いずれの場合も、クライアントデバイス100は、ゲームプレイを駆動するために使用される入力コマンドを介するなどして、ユーザ5のゲームプレイに対応付けられた実行エンジン211または111とインタラクトするように構成されている。
さらに、クライアントデバイス100は、ビデオゲームをプレイするときに、ゲームサーバ205とインタラクトし、ユーザ5のゲームプレイのメタデータを取り込み、格納するように構成され、そこで各メタデータは、ゲームプレイに関連する情報(たとえば、ゲーム状態など)を含む。さらに特に、ゲームサーバ205のゲームプロセッサ201は、ビデオゲームをプレイするときに、ユーザ5のゲームプレイのメタデータを生成する、及び/または受信するように構成される。
例えば、メタデータは、ゲームプロセッサ201へネットワーク150経由で出力され、配信される、クライアントデバイス100上のローカルゲーム実行エンジン111により生成され得る。加えて、メタデータは、ゲームプロセッサ201内でゲーム実行エンジン211により、例えば、エンジン211上で実行するビデオゲームのインスタンスにより、生成され得る。加えて、他の仮想マシンと関連するゲームサーバ205の他のゲームプロセッサは、他のユーザのゲームプレイと関連するビデオゲームのインスタンスを実行するように、またこれらのゲームプレイ中にメタデータを捕捉するように構成される。
以下で説明するように、メタデータは、本開示の実施形態による、ビデオゲームのゲームセッションにおけるシーンのカメラパースペクティブの生成のために、ならびにシーン及び/またはシーンのカメラパースペクティブのナレーションのAI制御された生成のために構成された、1つまたは複数のAIモデルをトレーニングするために使用され得る。
より具体的には、メタデータはまた、そのポイントでのゲームの状態を定義するゲーム状態データを含む。例えば、ゲーム状態データには、ゲームキャラクタ、ゲームオブジェクト、ゲームオブジェクトの属性、ゲーム属性、ゲームオブジェクトの状態、グラフィックオーバーレイなどがあり得る。このようにして、ゲーム状態データにより、ビデオゲームの対応するポイントで存在していたゲーム環境を生成することが可能になる。ゲーム状態データには、CPU、GPU、メモリの状態、レジスタ値、プログラムカウンタ値、プログラマブルDMA状態、DMA用のバッファデータ、オーディオチップ状態、CD-ROM状態など、ゲームプレイのレンダリングに使用されるあらゆるデバイスの状態が含まれることもある。
ゲーム状態データは、そのポイントからビデオゲームを実行するために、実行コードのどの部分をロードする必要があるかを識別することもできる。全てのゲーム状態データを取り込んで保存する必要はなく、対応するポイントでゲームを開始するための実行可能コードに十分なデータだけでよい。ゲーム状態データは、データストア140のゲーム状態データベース145に格納することができる。いくつかの実施形態では、いくつかのゲーム状態データは、メモリにのみ格納され得る。
またメタデータは、ユーザセーブデータを含む。一般的に、ユーザセーブデータは、対応するユーザについてのビデオゲームをパーソナライズする情報を含む。これには、ユーザのキャラクタに関連付けられた情報が含まれるため、ビデオゲームは、そのユーザ特有のものであり得るキャラクタ(例えば、形状、外観、衣服、武器など)でレンダリングされる。このようにして、ユーザセーブデータは、対応するユーザのゲームプレイ用のキャラクタの生成を可能にし、そのキャラクタは、メタデータに関連付けられたビデオゲームのポイントに対応する状態を有する。例えば、ユーザセーブデータは、ゲームをプレイするときにユーザ5が選択したゲーム難易度、ゲームレベル、キャラクタ属性、キャラクタ位置、残存ライフ数、利用可能なライフの可能総数、装甲、戦利品、タイムカウンタ値、及び他のアセット情報などを含むことができる。またユーザセーブデータは、例えば、ユーザ5を識別するユーザプロファイルデータを含むことができる。ユーザセーブデータをデータストア140のデータベース141に格納する。
加えて、メタデータは、人工知能を使用して生成され得るランダムシードデータも含む。ランダムシードデータは、元のゲームコードの一部ではない場合があるが、オーバーレイに追加して、ゲーム環境をユーザにとってより現実的、及び/または魅力のあるものに見せることができる。すなわち、ランダムシードデータは、ユーザのゲームプレイに対応するポイントに存在するゲーム環境についての追加の特徴を提供する。例えば、AIキャラクタがランダムに生成され、オーバーレイで提供されてもよい。AIキャラクタは、ゲームをプレイしているいかなるユーザとも関連付けられないが、ゲーム環境に配置され、ユーザのエクスペリエンスを向上させる。
ゲーム状態データには、AIがプレイヤとの以前のインタラクションを記憶して、それらのインタラクションがAIによる将来の決定に影響を与えることができるようにするなど、AIによって行われた学習が含まれ得る。例として、都市のシーンでは、これらのAIキャラクタがランダムに通りを歩くことができる。加えて、他のオブジェクトを生成し、オーバーレイで提示することができる。例えば、背景における雲、及び空間を通り抜けて飛ぶ鳥をオーバーレイ内に生成し、提示することができる。ランダムシードデータはデータストア140のランダムシードデータベース143に格納される。
このようにして、システム10は、ビデオゲームのゲームセッションにおけるシーンのカメラパースペクティブの生成のために、ならびにシーン及び/またはシーンのカメラパースペクティブのナレーションのAI制御された生成のために構成された、1つまたは複数のAIモデルをトレーニングするために使用され得る。具体的には、ゲームセッション中の1つまたは複数のビデオゲームの実行中、またはゲームセッションのリプレイ中に収集されたメタデータ、ならびにゲームセッションの記録のリプレイは、1つまたは複数のAIモデルをトレーニングするために使用され得る。例えば、ゲームサーバ205を含むクラウドゲームシステムは、AIサーバ260の深層学習エンジン190を使用して、統計及びファクト生成モデル、AIカメラパースペクティブモデル321及びAIナレーションモデル331をトレーニングするように構成され得る。また、深層学習エンジンを使用して、観客にとって関心がある可能性が高い観客関心ゾーンを識別することもできる。識別された観客関心ゾーンは、人工知能を使用して、観客が見ている可能性が高いカメラパースペクティブとナレーションを生成するために使用される。
したがって、クラウドゲームシステムは、後で観客によってアクセスされて、現在及び/または以前にプレイされたゲームセッションからのシーンの(例えば、カメラパースペクティブからの)リアルタイムでレンダリングされたビューを生成し、そのシーンにナレーションを提供することができ、レンダリングされるビューとナレーションは、人工知能を使用して生成される。
具体的には、カメラパースペクティブエンジン230は、AIカメラパースペクティブモデル321を実装して、対応するゲームセッションからシーンのレンダリングされたビューを生成するように構成され、レンダリングされたビューは、観客にとって高い関心がある可能性があると識別される1つまたは複数のカメラパースペクティブから生成される。また、ブロードキャスタ/ナレータエンジン220は、AIナレーションモデル331を実装して、シーン及び/またはそのシーンのカメラパースペクティブの解説及び/またはナレーションを生成するように構成され、解説は、テンプレートならびにそのシーンのゲームセッション中に収集されるメタデータに基づいて、AI統計/ファクトモデル341を使用して生成された統計及びファクトを使用して生成される。
図1Bは、本開示の一実施形態による、AIカメラパースペクティブ及びAIナレーションモデルを含む、人工知能(AI)モデルを構築するのに使用される例示的なニューラルネットワークを示す。このようにして、シングルプレイヤ及びマルチプレイヤセッションを含む1つまたは複数のゲームセッションを入力として与えられると、AIモデルは、観客にとって関心がある可能性のあるゲームセッションのシーンの観客関心ゾーンを識別するように構成され、AIモデルは、観客にとって関心がある可能性が高いシーンのビューまたはカメラパースペクティブを生成するように、及び/または、単独で提供されるナレーションを生成するように、またはそれらのシーンのカメラビューもしくはカメラパースペクティブを補完するように構成される。
したがって、AIモデルは、ビデオゲームのゲームセッションにおけるシーンのレンダリングされたビュー(例えば、カメラパースペクティブ)を生成し、シーン及び/またはシーンのカメラパースペクティブのナレーションを生成するように構成することができ、レンダリングされたビュー及び/またはナレーションは、ゲームセッション中またはゲームセッション後に観客にストリーミングされ得る。
より具体的には、AIカメラパースペクティブモデル及びAIナレーションモデルは、本開示の一実施形態に従って、深層学習エンジン190を使用してトレーニング及び/または構築される。一実施形態では、ニューラルネットワーク190を、バックエンドサーバのAIサーバ260内に実装し得る。具体的には、(例えば、AIモデラーを使用する)深層学習エンジン190は、ゲームセッション内のどのシーンの関心ゾーンが観客にとって最大の関心があるかを学習するように構成されており、ゲームセッション内の仮想化されたゲーム環境のシーンは、対応するAIモデルをトレーニングするときに、1つまたは複数のカメラパースペクティブから表示できる。
例えば、関心ゾーンは熟練者をフォローしている場合や、初心者が熟練者をキルする機会があるダビデとゴリアテの状況を定義している場合、または熟練者が自分の照準に犠牲者を入れているシナリオを定義する場合などがある。また、深層学習エンジン190は、AIカメラパースペクティブモデル321をトレーニングするときに、識別された関心領域に対応するシーンのどのビューが観客にとって最大の関心があるかを学習するように構成され得る。ビューは、シーンを示すゲーム環境内で撮影された1つまたは複数のカメラアングルによって定義できる。
さらに、深層学習エンジン190は、識別された関心ゾーンに対応するシーンのナレーションを構築するときに、どの統計及びファクトが観客にとって関心があるかを学習するように構成され得るものであり、ナレーションは、単独で提供され得るか、または観客にストリーミングされたときに識別された関心ゾーンに対応するシーンのビューを補完するように提供され得る。このようにして、1人または複数の観客は、観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンを見ることができ、ビューはライブゲームセッションのためにリアルタイムで提供することができ、または対応するゲームセッションのリプレイのために生成され得るものであり、リプレイは、ゲームセッション中、またはゲームセッションが終了した後にストリーミングされ得る。
具体的には、深層学習または機械学習エンジン190は(例えば、図示していないがAIモデラーと協力して)、1つまたは複数のビデオゲームの1つまたは複数のゲームセッション中、1つまたは複数のゲームセッションの観客ビュー中、1つまたは複数のゲームセッションのリプレイ中、1つまたは複数のゲームセッションのライブナレーションを有するライブブロードキャスト中などに収集されたトレーニングデータを分析するように構成されている。
学習及び/またはモデリングフェーズ中の深層学習エンジン190は、深層学習アルゴリズム、強化学習、またはその他の人工知能ベースのアルゴリズムを含む人工知能を利用して、トレーニングデータと成功基準を使用して1つまたは複数のトレーニングされたAIモデルを構築する(例えば、高い関心を生み出すなど)。トレーニングされたAIモデルは、観客にとって高い関心があるゲームセッションの対応するシーンの関心ゾーンを予測及び/または識別し、観客にとって高い関心があるシーンに対して生成できるビューとカメラパースペクティブを識別し、そして、識別された関心ゾーンに対応しかつ識別されたカメラパースペクティブに対応するシーンのナレーションを構築する際に使用するための統計及びファクトを識別または生成するように構成されている。
深層学習エンジン190は、任意の更新されたトレーニングデータが与えられると、トレーニングされたAIモデルを継続的に精緻化するように構成されてもよい。この精緻化は、トレーニングに使用できるトレーニングデータのセットを、それらのセットが、対応する成功基準に基づいて、深層学習エンジン190内でどのように機能するかに基づいて、決定することに基づいている。
追加のトレーニングデータは、人間の入力から収集及び/または分析され得る。例えば、プロのゲームイベントのためのブロードキャストを提供する分野の熟練者は、非常に価値のある入力データを提供するために利用され得る(すなわち、高い成功基準に関連付けられる)。これらの熟練者は、ゲームセッション中に追跡する必要のある関心ゾーン、それらの識別された関心ゾーンに対して生成する必要のあるビュー及び/またはカメラパースペクティブ、ならびに識別された関心ゾーンに対応し、識別されたカメラパースペクティブに対応するシーンのナレーションを構築するのに使用するために識別及び/または生成する必要のある統計及びファクト、を定義するのを助けることができる。
結果として得られるビデオゲームのAIモデルは、カメラパースペクティブエンジン230、ブロードキャスタ/ナレータエンジン220、及び/またはハイライトエンジン240によって使用され、任意の入力データのセット(例えば、ゲームセッション)を与えられて観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンを生成することができ、ビューはライブゲームセッションのためにリアルタイムで提供することができるか、または対応するゲームセッションのリプレイのために生成することができ、リプレイは、ゲームセッション中、またはゲームセッションの終了後にストリーミングされ得る。
ニューラルネットワーク190は、データセットを分析して、観客関心ゾーン、識別された観客関心ゾーンに対応するシーンのビュー及び/またはカメラパースペクティブ、ならびに、1人または複数の観客にとって高い関心がある、対応するゲームセッション中に収集または生成された統計及びファクトを含むナレーションを決定するための自動分析ツールの例を表す。様々なタイプのニューラルネットワーク190が可能である。一例では、ニューラルネットワーク190は、深層学習エンジン190によって実装され得る深層学習をサポートする。
したがって、教師ありまたは教師なしのトレーニングを用いたディープニューラルネットワーク、畳み込みディープニューラルネットワーク、及び/またはリカレントニューラルネットワークを実装することができる。別の例では、ニューラルネットワーク190は、(例えば、成功基準、成功メトリクスなどの使用による)強化学習、または報酬ベースの学習をサポートする深層学習ネットワークを含む。例えば、ニューラルネットワーク190は、強化学習アルゴリズムをサポートするマルコフ決定過程(MDP)としてセットアップされる。
一般に、ニューラルネットワーク190は、人工ニューラルネットワークなどの相互接続されたノードのネットワークを表す。各ノードは、データからある情報を学習する。相互接続を介して、ノード間で知識を交換することができる。ニューラルネットワーク190への入力により、ノードのセットがアクティブ化される。次に、このノードのセットは、他のノードをアクティブ化し、それにより入力に関する知識が伝播される。このアクティブ化プロセスは、出力が提供されるまで、他のノードにわたって繰り返される。
図示されるように、ニューラルネットワーク190は、ノードの階層を含む。最下位階層に、入力層191が存在する。入力層191は、入力ノードのセットを含む。例えば、これらの入力ノードのそれぞれは、ゲームアプリケーションのゲームプレイのインスタンスにマッピングされ、インスタンスは、そのインスタンス(例えば、コントローラ入力、ゲーム状態、結果データなど)を定義する1つまたは複数の特徴を含む。モデルの中間予測は、ラベル(例えば、出力、特徴、ノード、分類など)を作成する分類器を介して決定される。
最上位階層には、出力層193が存在する。出力層193は、出力ノードのセットを含む。出力ノードは、例えば、トレーニングされたAIモデル160の1つまたは複数のコンポーネントに関連する判断(例えば、関心ゾーン、カメラパースペクティブ、所与の入力データのセットに対する統計及びファクトなど)を表す。前述のように、出力ノードは、所与の入力のセットに対して、予測されるもしくは予想されるアクション、または学習されたアクションを識別することができ、入力は1つまたは複数のビデオゲームの1人または複数のシングルプレイヤ、またはマルチプレイヤのゲームセッションであり得る。
これらの結果は、深層学習エンジン190によって使用されるパラメータを精緻化及び/または修正して、所与の入力のセットに対する適切な予測されるまたは予想される応答及び/またはアクションを反復的に判断するために、現在及び/または以前のゲームセッション、及び/またはトレーニングデータの収集のために使用される、所定の及び真の結果と、あるいは、それらのゲームセッションのブロードキャストから得られる、学習されたアクション及び結果(例えば、成功の結果を駆動する人間の入力)と、比較することができる。つまり、ニューラルネットワーク190内のノードは、パラメータを精緻化する際に、そのような判断を行うために使用することができるトレーニングされたAIモデル(例えば、AIカメラパースペクティブモデル321、AIナレーションモデル331、統計及びファクトモデル341など)のパラメータを学習する。
具体的には、入力層191と出力層193との間に、隠れ層192が存在する。隠れ層192は、「N」個の隠れ層を含み、「N」は、1以上の整数である。次に、隠れ層のそれぞれはまた、隠れノードのセットも含む。入力ノードは、隠れノードと相互接続されている。同様に、隠れノードは、出力ノードと相互接続されているため、入力ノードは、出力ノードと直接相互接続されていない。複数の隠れ層が存在する場合、入力ノードは、最下位の隠れ層の隠れノードと相互接続される。次に、これらの隠れノードは、次の隠れ層の隠れノードと相互接続され、以下同様に続く。次の最上位の隠れ層の隠れノードは、出力ノードと相互接続される。相互接続は、2つのノードを接続する。相互接続は、学習することができる数値の重みを有し、ニューラルネットワーク190を入力に適応させて、学習可能にする。
一般に、隠れ層192により、入力ノードに関する知識が、出力ノードに対応する全てのタスク間で共有されることが可能となる。そのようにするため、一実施態様では、隠れ層192を介して入力ノードに変換fが適用される。一実施例では、変換fは非線形である。例えば、整流関数f(x)=max(0,x)を含む様々な非線形変換fが利用可能である。
ニューラルネットワーク190はまた、最適解を見つけるためにコスト関数cを使用する。コスト関数は、所与の入力xに関してf(x)と定義されたニューラルネットワーク190によって出力される予測と、グラウンドトゥルースまたはターゲット値y(例えば見込まれる結果)との偏差を測定する。最適解は、最適解のコストよりコストの低い解がない状況を表す。コスト関数の例として、グラウンドトゥルースラベルが利用可能なデータの場合、予測とグラウンドトゥルースとの平均二乗誤差が挙げられる。学習プロセス中に、ニューラルネットワーク190は、誤差逆伝播アルゴリズムを使用して、様々な最適化方法を採用し、コスト関数を最小化するモデルパラメータ(例えば隠れ層192内のノード間の相互接続の重み)を学習し得る。このような最適化方法の一例として、確率的勾配降下法が挙げられる。
一実施例では、ニューラルネットワーク190用のトレーニングデータセットは、同じデータ領域からのものであり得る。例えば、ニューラルネットワーク190は、所与の入力のセットまたは入力データ(例えば、ゲームセッション)に対して実行すべき予測されるまたは予想される応答及び/またはアクションを学習するようにトレーニングされる。この説明では、データドメインには、複数のユーザの複数のゲームプレイを通じて収集されたゲームセッションデータ、ゲームセッションの観客のビュー、関心ゾーンを選択する熟練者によって提供される人間の入力、カメラパースペクティブ、及びベースライン入力データを定義するために使用される統計及びファクトが含まれる。別の実施例では、トレーニングデータセットは、ベースライン以外の入力データを含むように、様々なデータ領域からのものである。
これらの予測結果に基づいて、ニューラルネットワーク190はまた、それらの結果及び/または入力のセット(ゲームセッションなど)が与えられた場合に実行されるアクション(例えば、予測された関心ゾーン、カメラパースペクティブ、及びナレーションを構築するために使用される統計及びファクト)を決定するために使用されるトレーニングされたAIモデルを定義し得る。そのため、AIモデルは、任意の入力データのセット(ゲームセッションなど)を与えられて、観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンを生成するように構成されており、ビューはライブゲームセッションのためにリアルタイムで提供することができ、または対応するゲームセッションのリプレイのために生成され得るものであり、リプレイは、ゲームセッション中、またはゲームセッションが終了した後にストリーミングされ得る。
図2は、本開示の一実施形態による、1つまたは複数のビデオゲームの1つまたは複数のゲームセッションにおいて、対応するユーザに対してローカルで、またはバックエンドクラウドゲームサーバで実行されている1つまたは複数のビデオゲームをプレイする1人または複数のユーザにゲーム制御を提供するシステム200を示し、1つまたは複数のゲームセッションは人工知能によってAIカメラパースペクティブモデルとAIナレーションモデルをトレーニングするために使用され、AIモデルは、ゲームセッションのカメラパースペクティブを識別し、観客が見る可能性が最も高いそれらのゲームセッションのシーンに対してナレーションを提供するために使用される。
他の実施形態では、AIモデルを使用して、AIで識別された統計及びファクトを使用したナレーションを伴うシングルプレイヤまたはマルチプレイヤのゲームセッションのシーンのレンダリングされたビューを生成し、その後、1人または複数の観客にストリーミングする。一実施形態では、システム200は、図1Aのシステム10と連動して機能し、ゲームセッションのカメラパースペクティブを生成するように構成されたAIモデルをトレーニング及び/または実装し、観客が見る可能性が最も高いゲームセッションのシーンにナレーションを提供する。ここで図面を参照すると、同様の参照番号は、同一の部分または対応する部分を示す。
図2に示すように、複数のユーザ115(例えば、ユーザ5A、ユーザ5B…ユーザ5N)は、1つまたは複数のゲームセッションにわたって複数のビデオゲームをプレイしている。ゲームアプリケーションのそれぞれは、対応するユーザの対応するクライアントデバイス100(例えば、ゲームコンソール)上でローカルに、またはバックエンドクラウドゲームシステム210で実行され得る。加えて、複数のユーザ115のそれぞれは、トレーニングに使用されるゲームセッションのために、またはAIモデルを使用して構築された現在または以前のゲームセッションの興味深いシーンのレンダリングされた画像を表示するためにそれぞれ構成されたディスプレイ12またはデバイス11にアクセスできる。
具体的には、システム200は、本開示の一実施形態に従って、ローカルで実行されている1つまたは複数のビデオゲームをプレイする複数のユーザ115にゲーム制御を提供する。例えば、ユーザ5Aは、対応するクライアントデバイス100上で第1のゲームアプリケーションをプレイすることができ、第1のゲームアプリケーションのインスタンスは、対応するゲームロジック177A(例えば、実行可能コード)及びゲームタイトル実行エンジン111Aにより実行される。例示目的のために、ゲームロジックは、対応するクライアントデバイス100に、ポータブルメディア(例えばフラッシュドライブ、コンパクトディスクなど)を介して、またはネットワークを介して配信され得る(例えばインターネット150を介してゲームプロバイダからダウンロードされ得る)。さらに、ユーザ115Nは、対応するクライアントデバイス100上で第Nのゲームアプリケーションをプレイし、第Nのゲームアプリケーションのインスタンスは、対応するゲームロジック177N及びゲームタイトル実行エンジン111Nにより実行される。
加えて、システム200は、本開示の一実施形態に従って、クラウドゲームシステム210上で実行されている1つまたは複数のビデオゲームをプレイする複数のユーザ115にゲーム制御を提供する。クラウドゲームシステム210は、複数のインタラクティブビデオゲームまたはゲームアプリケーションへのアクセスを提供するゲームサーバ205を含む。ゲームサーバ205は、クラウド内で利用可能な任意の種類のサーバコンピューティングデバイスであり得るもので、1つまたは複数のホスト上で実行される1つまたは複数の仮想マシンとして構成され得る。例えば、ゲームサーバ205は、ユーザのゲームアプリケーションのインスタンスをインスタンス化するゲームプロセッサをサポートする仮想マシンを管理し得る。
このようなものとして、複数の仮想マシンと関連するゲームサーバ205の複数のゲームプロセッサは、複数のユーザ115のゲームプレイと関連するゲームアプリケーションの複数のインスタンスを実行するように構成される。このようにして、バックエンドサーバサポートは、複数の対応するユーザ(例えば、プレイヤ、観客など)に、複数のビデオゲームのゲームプレイのメディア(例えば、ビデオ、オーディオなど)のストリーミングを提供する。
いくつかの実施形態では、クラウドゲームネットワークは、ホストマシンのハイパーバイザ上で動作する複数の仮想マシン(VM)を含むゲームクラウドシステム210であってもよく、1つまたは複数の仮想マシンが、ホストのハイパーバイザで利用可能なハードウェアリソースを利用して、ゲームプロセッサを実行するように構成されている。1人または複数のユーザは、クライアントデバイス100または100’を使用してビデオゲームのリモート処理のためにネットワーク150を介してゲームクラウドシステム210にアクセスすることができ、クライアントデバイス100’は、(例えば、ゲーム実行エンジン211を含む)計算機能を提供するバックエンドサーバとインタフェースするシンクライアントとして構成され得る。
例えば、ユーザ5Bは、対応するクライアントデバイス100’上で第2のビデオゲームをプレイしており、第2のビデオゲームのインスタンスは、クラウドゲームシステム200の対応するゲームタイトル実行エンジン211により実行される。第2のビデオゲームを実装するゲームロジック(例えば、実行可能コード)は、ゲームタイトル処理エンジン211と連携して実行され、第2のビデオゲームを実行する。ユーザ5Bは、レンダリングされた画像を表示するように構成された少なくともデバイス11にアクセスすることができる。
クライアントデバイス100または100’は、ゲームコントローラ、タブレットコンピュータ、キーボードなどの様々な種類の入力デバイスからの入力、及びビデオカメラ、マウス、タッチパッドなどにより取り込まれたジェスチャを受信し得る。クライアントデバイス100及び100’は、メモリとプロセッサモジュールとを少なくとも有する任意の種類のコンピューティングデバイスであり得るもので、ネットワーク150を介してゲームサーバ205に接続することができる。また、対応するユーザのクライアントデバイス100及び100’は、ローカルまたはリモートで作動するゲームタイトル実行エンジン111により実行されるレンダリングされた画像を生成するように、及びレンダリングされた画像をディスプレイに表示するように、構成される。例えば、対応するクライアントデバイス100または100’は、ゲームプレイを駆動するために使用される入力コマンドなどを通して、対応するユーザのゲームプレイを実装するためにローカルに、またはリモートに実行されるような対応するビデオゲームのインスタンスとインタラクトするように構成される。
一実施形態において、クライアントデバイス100は、ゲームアプリケーションをプレイする、対応するユーザについてシングルプレイヤモードで動作する。
別の実施形態において、複数のクライアントデバイス100は、特定のゲームアプリケーションを各プレイする、対応するユーザについてマルチプレイヤモードで動作する。この場合、ゲームサーバ205を介したバックエンドサーバサポートは、マルチプレイヤ処理エンジン119を介するなどして、マルチプレイヤ機能を提供し得る。具体的には、マルチプレイヤ処理エンジン119は、特定のゲームアプリケーションのマルチプレイヤゲームセッションを制御するように構成される。例えば、マルチプレイヤ処理エンジン130は、マルチプレイヤゲームセッションに参加しているユーザ及び/またはプレイヤのそれぞれと通信セッションを確立し維持するように構成されたマルチプレイヤセッションコントローラ116と、通信する。このようにして、セッション中のユーザは、マルチプレイヤセッションコントローラ116により制御されるように、相互と通信することが可能である。
さらに、マルチプレイヤ処理エンジン119は、各ユーザの対応するゲーム環境内でユーザ間のインタラクションを可能にするために、マルチプレイヤロジック118と通信する。具体的には、状態共有モジュール117は、マルチプレイヤゲームセッションにおいてユーザそれぞれの状態を管理するように構成される。例えば、状態データは、特定ポイントにおける対応するユーザの(ゲームアプリケーションの)ゲームプレイの状態を定義するゲーム状態データを含み得る。例えば、ゲーム状態データには、ゲームキャラクタ、ゲームオブジェクト、ゲームオブジェクト属性、ゲーム属性、ゲームオブジェクト状態、グラフィックオーバーレイなどが含まれ得る。このようにして、ゲーム状態データにより、ゲームアプリケーション内の対応するポイントに存在するゲーム環境の生成が可能となる。
ゲーム状態データには、CPU、GPU、メモリの状態、レジスタ値、プログラムカウンタ値、プログラマブルDMA状態、DMA用のバッファデータ、オーディオチップ状態、CD-ROM状態など、ゲームプレイのレンダリングに使用されるあらゆるデバイスの状態が含まれることもある。ゲーム状態データは、そのポイントからビデオゲームを実行するために、実行コードのどの部分をロードする必要があるかを識別することもできる。ゲーム状態データは、図1Aのデータベース140に格納され得るものであり、状態共有モジュール117によりアクセス可能である。
さらに、状態データは、対応するプレイヤのビデオゲームをパーソナライズする情報を含む、ユーザセーブデータを含み得る。これには、ユーザがプレイするキャラクタに対応付けられた情報が含まれるため、ビデオゲームは、そのユーザに特有であり得るキャラクタ(例えば位置、形状、外観、衣服、兵器など)でレンダリングされる。このようにして、ユーザセーブデータにより、対応するユーザのゲームプレイ用のキャラクタを生成することが可能となり、キャラクタは、対応するユーザが現在体験しているゲームアプリケーション内のポイントに対応する状態を有する。例えば、ユーザセーブデータは、ゲームをプレイするときに対応するユーザが選択したゲーム難易度、ゲームレベル、キャラクタ属性、キャラクタ位置、残存ライフ数、利用可能ライフの可能総数、装甲、戦利品、タイムカウンタ値などを含み得る。ユーザセーブデータはまた、対応するユーザを識別するユーザプロファイルデータを含み得る。ユーザセーブデータをデータベース140に格納することができる。
このようにして、状態共有データ117及びマルチプレイヤロジック118を用いるマルチプレイヤ処理エンジン119は、マルチプレイヤゲームセッションに参加するユーザのゲーム環境のそれぞれに、オブジェクト及びキャラクタをオーバーレイ/挿入することができる。例えば、第1のユーザのキャラクタは、第2のユーザのゲーム環境にオーバーレイ/挿入される。これは、マルチプレイヤゲームセッションにおけるユーザ間のインタラクションを、自身の各ゲーム環境のそれぞれを介して(例えば、画面上に表示されるように)可能にする。
加えて、ゲームサーバ205を介したバックエンドサーバサポートは、ビデオゲームのゲームセッションにおけるシーンのAIレンダリングされたビュー(例えば、カメラパースペクティブ)を生成し、シーン及び/またはシーンのカメラパースペクティブのナレーションを生成することができ、レンダリングされたビュー及び/またはナレーションは、ゲームセッション中またはゲームセッション後に観客にストリーミングされ得る。このようにして、1人または複数の観客は、観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンを見ることができ、ビューはライブゲームセッションのためにリアルタイムで提供することができ、またはAIサーバ260によって実装されるようなAIモデルを使用して、対応するゲームセッションのリプレイのために生成され得る。
具体的には、AIモデルは、観客にとって関心がある可能性のある1つまたは複数のゲームセッションで観客関心ゾーンを識別するために使用される。ビデオゲームのゲームセッションのシーンに対応する特定の識別された観客関心ゾーンについて、カメラパースペクティブエンジンは、AIカメラパースペクティブモデルを使用して、観客にとって関心のあるシーンの1つまたは複数のカメラパースペクティブを生成または識別する。
加えて、シーンに対応する特定の識別された観客関心ゾーンについて、ブロードキャスタ/ナレータエンジン220は、AIナレーションモデルを使用して、ゲーム状態データ及びシーンに対応するゲームセッションに関連する他の情報に基づいて統計及びファクトを識別及び/または生成する。生成された統計及びファクトは、解説テンプレートを使用して一緒に織り込まれ、単独でストリーミングしたり、シーンの1つまたは複数のカメラパースペクティブとともに1人または複数の観客にストリーミングしたりできる解説を生成する。
さらに、クラウドゲームシステム210のハイライトエンジン240は、AIモデルを使用して現在または以前のゲームセッションのAIレンダリングビューを生成して、1つまたは複数のゲームセッションの1つまたは複数のシーンに対応する識別された観客関心ゾーンの1つまたは複数のレンダリングビュー(例えば、カメラパースペクティブ)を生成し、それらのシーンのためのナレーションを提供するように構成される。ハイライトリールは、AIレンダリングされたビュー及びAI生成ナレーションを含むハイライトエンジン240によって生成され、1人または複数の観客にストリーミングされ得る。
図3Aは、本開示の実施形態による、複数のビデオゲームの複数のゲームセッションにおいて観客関心ゾーンを識別し、それらの識別された観客関心ゾーンの関心があるカメラパースペクティブを識別し、それらの識別された観客関心ゾーンのシーンに対する解説及び/またはナレーションを生成する1つまたは複数のAIモデルを、トレーニングするように構成されたシステム300Aを示す。システム300はまた、AIモデルを使用して、ビデオゲームのゲームセッションにおいてAIで識別されたシーンのレンダリングされたビュー(例えば、カメラパースペクティブ)を生成し、シーン及び/またはシーンのカメラパースペクティブのナレーションを生成するように構成され、レンダリングされたビュー及び/またはナレーションは、対応するゲームセッション中、または対応するゲームセッションの終了後に観客にストリーミングされ得る。
いくつかの実施形態では、ゲームの1つまたは複数のレンダリングは、AIトレーニングされたカメラパースペクティブモデル321を使用するなど、人工知能(AI)によって生成される。一実施形態において、AIカメラパースペクティブモデル321はカメラアングルを制御して、最も関心のあるアクションをキャプチャし、アングル間をカットして、単一のビューに収まらないアクションを組み込み、様々な視点からアクションを表示できる。AIカメラパースペクティブモデル321は、カメラアングルを選択して、狙撃兵と狙撃兵が狙っているターゲットの両方を示すアングルなど、疑わしいアクションの全体ビューを含めることができる。
別の実施形態では、AI関心ゾーンモデル311は、ゲーム及びプレイヤの関心の多くの側面を考慮に入れて、どのアクションが視聴者にとって最も関心があるかを決定できる。観客ごとに異なるストリームを生成できる。さらに別の実施形態では、AIナレーションモデル331は、それが生成するゲームストリームに解説を追加することができる。別の実施形態において、ハイライトエンジンは、ストリームにアクションのリプレイを含めることができるため、観客は異なる視点からエキサイティングなアクションを再び見ることができ、ゲームのライブカメラビューでは発生しなかったアクションを見ることができる。
トレーニングのために、システム300Aは、1つまたは複数のビデオゲームの1つまたは複数のゲームセッションから、入力としてメタデータ、プレイヤ統計、及び他の情報を受信し、ゲームセッションは、シングルプレイヤまたはマルチプレイヤのゲームセッションであり得る。1つまたは複数のゲームセッションは、ビデオゲームをプレイする1人または複数のプレイヤから(例えば、教師あり学習のために)生成され得るか、またはビデオゲームをプレイする1人または複数のAIプレイヤから(例えば、教師なし学習のために)生成され得るか、または、1人または複数の人間のプレイヤ及び/または1つまたは複数のAIプレイヤの組み合わせから生成され得る。加えて、人間の入力は、熟練者の選択及び/または観客関心ゾーンの定義、カメラパースペクティブ、及び/またはナレーションに使用される統計及びファクトなどのトレーニングデータとして提供される場合がある。
例えば、プレイヤ1のゲーム空間301Aは、対応するビデオゲームのゲームセッションに関連付けられ、メタデータ302A及びプレイヤ統計303Aは、人工知能を使用して観客関心ゾーンモデル311をトレーニングするためのAI観客関心ゾーントレーナ310への入力として提供される。同様のデータが収集され、プレイヤ2のゲームスペース301BからプレイヤNのゲームスペース301Nまでの入力として提供される。したがって、入力のセット(例えば、1つまたは複数のゲームセッション)が与えられると、観客関心ゾーンモデル311は、1人または複数の観客にとって高い関心がある可能性のある1つまたは複数の識別された観客関心ゾーン312を出力するようにトレーニングされる。AI観客関心ゾーントレーナ310及び関心ゾーンモデル311のトレーニング及び実装のより詳細な説明が図3Bに提供されている。
識別された観客関心ゾーンのそれぞれは、ゲームセッションのために実行されているビデオゲームの対応するシーンに関連付けられている。ゲームに対して(例えば、プレイヤに対して)異なるカメラパースペクティブを生成することも、人工知能を使用してゲーム状態データを使用して新たに生成することもできる。後の時点で新しいカメラアングルのレンダリングを生成する利点の1つは、特定のアクションを識別してリプレイに表示することができ、次にそのアクションを最もよく示すカメラアングルを計算することができ、次にそのカメラアングルからのアクションのレンダリングを生成できることである。これにより、アクションの発生中に識別された(例えば、ゲームによって最初に生成された)どのカメラアングルよりも有利なカメラアングルからのアクションのリプレイが可能になる。
新しく識別され生成されたカメラアングルは、次にリプレイにおいて表示できる。例えば、これは、関心のあるアクションにつながるイベントを表示するために実装されると(例えば、リプレイ中)、それらのイベントが最初は興味深くは思われなかった場合、つまり、それらのイベントが興味深いアクション(例えば、関心アクション)につながることが知られる前に発生した場合に役立つ。一般に、AIカメラパースペクティブトレーナ320は、関心ゾーンモデル311からの識別された観客関心ゾーン出力のための1つまたは複数のカメラパースペクティブを入力として受信するように構成される。
成功基準に基づいて、AIカメラパースペクティブトレーナは、カメラパースペクティブモデル321をトレーニングして、対応する選択及び/または識別された観客関心ゾーンの対応するシーンについて、少なくとも1つの識別されたビューまたはカメラパースペクティブ322を出力するように構成され、このカメラパースペクティブは、1人または複数の観客にとって高い関心があるものである。AIカメラパースペクティブトレーナ320及びカメラパースペクティブモデル321のトレーニング及び実装のより詳細な議論が図3Cに提供されている。
加えて、対応する識別された観客関心ゾーンの各シーンについて、人工知能を使用して解説を作成できる。具体的には、AIブロードキャスタ/ナレータトレーナ330は、入力として、対応するゲームセッションから1つまたは複数の統計及びファクトを受信する。成功基準に基づいて、AIブロードキャスタ/ナレータトレーナ330は、ナレーションモデル331をトレーニングして、観客にとって高い関心がある統計及びファクトを識別し、解説テンプレートを使用するなどして、それらの識別された統計及びファクトを解説及び/またはナレーション332に織り込むように構成される。AIブロードキャスタ/ナレータトレーナ330及びナレーションモデル331のトレーニング及び実装のより詳細な議論が図3Dに提供されている。
図3Bは、本開示の一実施形態による、観客にとって関心がある可能性のある観客関心ゾーンを識別するために使用される観客関心ゾーンモデル311を、人工知能を使用してトレーニングするために使用されるシステム300Bを示す。システム300Bは、クラウドゲームシステム210内、より具体的には、クラウドゲームシステム210のAIサーバ260内に実装され得る。
トレーニングのために、システム300Bは、1つまたは複数のビデオゲームの1つまたは複数のゲームセッションから、入力としてメタデータ、プレイヤ統計、及び他の情報を受信し、ゲームセッションは、シングルプレイヤまたはマルチプレイヤのゲームセッションであり得る。1つまたは複数のゲームセッションは、ビデオゲームをプレイする1人または複数のプレイヤから(例えば、教師あり学習のために)生成され得るか、またはビデオゲームをプレイする1人または複数のAIプレイヤから(例えば、教師なし学習のために)生成され得るか、または、1人または複数の人間のプレイヤ及び/または1つまたは複数のAIプレイヤの組み合わせから生成され得る。
例えば、プレイヤ1のゲーム空間301Aは、対応するビデオゲームのゲームセッションに関連付けられ、メタデータ302A及びプレイヤ統計303Aは、人工知能を使用して観客関心ゾーンモデル311をトレーニングするためのAI観客関心ゾーントレーナ310への入力として提供される。さらに、プレイヤ2のゲーム空間301Bは、対応するビデオゲームのゲームセッションに関連付けられ、メタデータ302B及びプレイヤ統計303Bは、観客関心ゾーンモデル311をトレーニングするためのAI観客関心ゾーントレーナ310への入力として提供される。
追加の入力データが提供される。例えば、プレイヤNのゲーム空間301Nは、対応するビデオゲームのゲームセッションに関連付けられ、メタデータ302N及びプレイヤ統計303Nは、観客関心ゾーンモデル311をトレーニングするためのAI観客関心ゾーントレーナ310への入力として提供される。加えて、人間の入力は、熟練者の選択及び/または観客関心ゾーンの定義、カメラパースペクティブ、及び/またはナレーションに使用される統計及びファクトなどのトレーニングデータとして提供される場合がある。
前述のように、メタデータはトレーニングに使用される対応するゲームセッション中に収集され、ゲーム状態やその他のユーザ情報を含むことができる。例えば、ゲーム状態データは、ビデオゲームのゲーム環境を生成するために使用されるポイントでのゲームの状態を定義し、ゲームキャラクタ、ゲームオブジェクト、ゲームオブジェクト属性、ゲーム属性、ゲームオブジェクト状態、グラフィックオーバーレイなどを含み得る。ゲームの状態には、ゲームプレイのレンダリングに使用される全てのデバイス(CPU、GPU、メモリなど)の状態が含まれ得る。ゲーム状態には、例えば人工知能を使用して生成されたランダムシードデータも含まれ得る。
ゲーム状態には、ビデオゲームのパーソナライズに使用されるデータなど、ユーザセーブデータも含まれ得る。例えば、ユーザセーブデータは、特定のユーザのキャラクタをパーソナライズできるため、ビデオゲームは、そのユーザに特有であり得るキャラクタ(例えば形状、外観、衣服、兵器類など)でレンダリングされる。ユーザセーブデータには、ユーザ定義のゲーム難易度、ゲームレベル、キャラクタ属性、キャラクタ位置、残存ライフ数、アセット情報などが含まれる。ユーザセーブデータには、ユーザプロファイルデータが含まれてもよい。
また、プレイヤの統計には、ユーザ(例えば、プレイヤ1)のプロファイル情報、または、プレイヤの名前、プレイしたゲーム、プレイしたゲームの種類、専門知識のレベルなど、プレイヤ1に一般的に適用されるその他の収集された統計が含まれ得る。プレイヤの統計はまた、ユーザプロファイルデータを含むか、それに基づくこともできる。
前述のように、関心ゾーントレーナ310は、深層学習エンジン190を実装して、1つまたは複数のビデオゲームの1つまたは複数のゲームセッション中に、1つまたは複数のゲームセッションの観客ビュー中に、1つまたは複数のゲームセッションのリプレイ中に、1つまたは複数のゲームセッションのライブナレーション、人間の入力などを有するライブブロードキャスト中に収集された、人工知能トレーニングデータを使用して分析して、観客にとって高い関心がある観客関心ゾーンを識別する。具体的には、深層学習エンジン190は、学習及び/またはモデリングフェーズ中に、深層学習アルゴリズム、強化学習、または他の人工知能ベースのアルゴリズムを含む人工知能を利用して、トレーニングデータ及び成功基準を使用して関心ゾーンモデル311を構築する。
例えば、関心ゾーンモデル311をトレーニングするためにフィードバックループが提供され得る。具体的には、各反復で、フィードバックループは、1つまたは複数の識別された観客関心ゾーン312を出力するときに、関心ゾーントレーナ310によって使用される成功基準を精緻化するのに役立ち得る。示されるように、トレーニングされている関心ゾーンモデル311を介したAI観客関心ゾーントレーナ310は、所与の入力のセットに対して1つまたは複数の潜在的な関心ゾーンを出力として提供することができる。入力は、1つまたは複数のビデオゲームの1つまたは複数のゲームセッションに関連付けることができる。
説明を容易にするために、フィードバックプロセスは、シングルプレイヤまたはマルチプレイヤのゲームセッションなどの1つのゲームセッションから提供されている入力のセットに関連して説明されている。加えて、ゲームセッションはライブであるか、すでに行われている可能性がある。このようにして、以前のゲームセッションに対応する履歴ゲームデータを使用して、関心ゾーンモデル311をトレーニングして、ゲームセッションにおけるアクションをフォローする方法をよりよく予測し、観客にとって関心があるものを選択することができる。
具体的には、提供されている出力313は、入力のセットとして提供されるゲームセッションのための過去、現在、及び将来の観客関心ゾーンを含み得る。出力313として提供される現在の関心ゾーンは、進行中のゲームセッション、または終了したが記録されたゲーム状態データを使用してリプレイされているゲームセッションにおいて、興味深い関心ゾーンのリアルタイム追跡を提供し得る。出力313として提供される過去の関心ゾーンは、現在進行中のゲームセッションでの、または終了したゲームセッションについての以前のゲームプレイを評価することができる。出力313として提供される将来の関心ゾーンは、潜在的に発生する可能性のあるゲームセッション(ライブまたは終了したもの)における関心のあるシナリオを評価し得るもので、その結果、関心ゾーンモデル311は、ライブまたはゲーム状態データを使用してリプレイされているゲームセッションにおけるアクションをフォローするように構成され得る。
関心ゾーンの特徴付けは、(例えば、ゲーム状態データまたはゲームセッションの統計によって)1人または複数の観客にとって関心があるものを識別するのを助けるために定義され得る。例えば、関心ゾーンは、特定のイベント、状況、またはシナリオなど(例えば、ダビデとゴリアテ、アンダードッグ、目標の達成、レベルの克服など)によって定義され得る。別の例では、関心ゾーンは、ゲーム内で中枢となる重要なシーンなどのビデオゲーム内のシーン(例えば、キャラクタがより高い状態に進化することを可能にするタスクの頂点に到達すること)によって定義され得る。
さらに別の例では、関心ゾーンは、特定の地理的エリア及び/またはゲーム世界の領域に到達すること、またはキャラクタがボスと交戦しようとしているところでボスレベルに到達するときなど、ビデオゲームのセクションまたはセグメントによって定義され得る。さらに別の例では、関心ゾーンは、キャラクタがビデオゲームで山をスケーリングしてターゲットに到達しようとしているときなど、特定の関心のあるアクションによって定義され得る。別の例では、関心ゾーンは、シャーデンフロイデクラスターによって定義される場合がある。これにより、1人または観客がプレイヤの没落を見るのを楽しむことができる。本開示の実施形態では、さらに他の定義がサポートされている。
別の例では、関心ゾーンは、ゲームセッションにおける2人のプレイヤ間の関係によって定義され得る。あるケースでは、2人の熟練者プレイヤ(例えば、プロ)が、ビデオゲームのゲームの世界で互いにある地理的な距離内にいる場合があり、この2人が直接対決のマッチアップで出会う可能性が高い。別のケースでは、低レベルのプレイヤがキルショットで熟練者プレイヤを倒すように設定されている場合があり(例えば、ダビデとゴリアテまたはアンダードッグのシナリオ)、この場合、低レベルのプレイヤは、熟練者が低レベルのプレイヤを倒す前に1回だけチャンスがある。
別のケースでは、低レベルのプレイヤが熟練者(例えば、狙撃率が高い)の照準内にいる。別の例では、関心ゾーンは、プレイヤによって定義され得るものであり、1人または複数の観客の間で人気のあるプレイヤは、関心ゾーンで追跡され得る。さらに別の例では、プレイヤは、観客が見るように調整され得る狙撃シナリオをこのプレイヤが探していることを示す高い狙撃率を有するなど、観客が見るように強いる特定の特性を有し得る。関心ゾーンにはタイミング特性が含まれる場合があり、狙撃率が高いプレイヤは自分の照準内にターゲットを入れることができる。関心ゾーンは、地理的特性を含み得るもので、高い狙撃率を有するプレイヤは、ゲーム世界の特定のエリア内にあり得るもので、そのエリアは、標的が豊富であり得る。本開示の実施形態では、さらに他の定義がサポートされている。
別の例では、関心ゾーンは、プレイヤの予測されるアクションまたは結果によって特徴付けられ得る。例えば、関心ゾーンは、(例えば、難しい作業、または難しい地形を横断する必要があるなど)レベルアップの割合が高い、またはキャラクタの死亡率が高いビデオゲームのゲーム世界のエリアまたは領域として定義され得る。他の例では、関心ゾーンは、成功率が低い、または成功率が高いゲーム条件(タスクを実行する)として定義され得る。本開示の実施形態では、さらに他の定義がサポートされている。
他の例では、関心ゾーンを定義する人気のあるプレイヤをフォローするための選好を与えることができる。また、近くに他のプレイヤがいない状態で隠れているプレイヤをフォローするのではなく、近くに他のプレイヤが多いエリアのプレイヤをフォローするなど、排除される可能性が高いプレイヤをフォローすることも選好できる。どのプレイヤをフォローするかは、どのフィードがゲームを見ている観客に最も人気があるか、から部分的または完全に決定できる。観客は直接投票することも、表示するフィードやフォローするプレイヤを直接選択して間接的に投票することもできる。
トレーニング中に出力311として提供される関心ゾーンは、成功基準を定義するのを助けるために、さらにフィルタリングされ、AI観客関心ゾーントレーナ310にフィードバックされ得る。例えば、関心ゾーンは、ヒューマンインザループ、または他の観客の能動的及び/または受動的メトリックのいずれかを介して選択できる。
具体的には、観客の視聴の選択は、AIモデルを使用してどの関心ゾーンが選択されるかに影響を与える。例えば、出力313として提供される関心ゾーンのそれぞれは、選択を通じて1人または複数の観客が見ることができるゲームセッションの部分に対応することができる。その選択は、観客にとって興味深いと定義された好都合な関心ゾーンの成功基準を定義するのに役立ち得る。いくつかの場合では、観客は、1つまたは複数のライブゲームセッションの選択肢から、または1つまたは複数のリプレイの選択肢から選択可能なゲームセッションのリプレイを通じて、ライブのゲームセッションを表示することを能動的に選択することができる。いくつかの実施態様では、観客は、自動的に、または表示するために選択できる選択肢として提示される、リプレイの基準を設定できる。いくつかの場合では、観客は、人間によって制御されるリプレイのストリームを表示することを選択することによって、及び/または人工知能が、AIの選択と生成によって制御されるリプレイのストリームを表示することを選択することによって、AI関心ゾーンモデル311によって定義されるものを強化することを選択することができる。
AI観客関心ゾーントレーナ310への肯定的なフィードバックとして提供される、定義された観客が選択した関心ゾーン315など、どの関心ゾーンが観客に好都合であるかを定義するのに役立つ観客によるアクション360の例は、以下に提供されており、例示を目的としたものであり、網羅的なものを意図したものではない。例えば、しきい値を超える観客のジャンプインカウント360Aは、関心ゾーンが観客にとって好都合であることを示す。また、対応する観客関心ゾーンを含むゲームセッションの部分の視聴中に解説またはテキストフィードバックとして提供される肯定的な観客フィードバック360Bは、特にたくさんの肯定的なフィードバックがある場合に、観客にとって好都合な対応する関心ゾーンを定義するのに役立ち得る。
さらに、対応する観客関心ゾーンを含むゲームセッションの部分の視聴中の能動的または受動的な観客アクション360Cは、観客に好都合な対応する関心ゾーンを定義するのに役立ち得る。例えば、受動的なアクションには、バイオフィードバック(例えば、発汗、笑顔など)が含まれ得る。別の例では、能動的なアクションには、ゲームセッションの視聴などに肯定的な関心を示すアイコンの選択が含まれ得る。観客は直接投票するか、表示するフィードまたはフォローするプレイヤを直接選択して間接的に投票できる。例えば、対応する観客関心ゾーンを含むゲームセッションの一部のリプレイが、どれほど人気があるかを示す観客のリプレイカウント360Dは、観客にとって好都合な対応する関心ゾーンの定義に役立ち得る。
観客がフォローすることを選択した関心ゾーンは、関心ゾーンがどれほど興味深いかを示す指標として使用できる。例えば、観客が特定のプレイヤをフォローしている関心ゾーンをフォローするように切り替えると、それは関心ゾーンが観客にとって関心があることを示す指標として使用できる。いくつかの場合では、観客は自分自身のカメラアングルを選択して表示することができる。
選択されたカメラアングルは、関心のあるアクションが発生している場所の指標として使用でき、これは、関心ゾーンまたは特定のカメラアングルを決定する際に使用できる。別の例では、対応する観客関心ゾーンを含むゲームセッションの一部のリプレイが、どれほど人気があるかを示すライブゲームセッションの観客のストリーミングビューカウント360Eは、観客にとって好都合な対応する関心ゾーンを定義するのに役立ち得る。本開示の実施形態では、観客のフィードバックを提供するさらに他の定義がサポートされている。
観客には、拍手、ブーイング、あくびなどの反応を単純に選択する機能も与えられ得る。これらを集約してトーナメントのプレイヤに表示したり、収集したりして、関心ゾーンまたはアクションへの観客の注目のレベルを判断することもできる。いくつかの場合では、観客は、全体的なアクション、特定のアクション、非プレイヤキャラクタのアクティビティ、または特定のプレイヤのアクティビティに関連するフィードバックを与えることができる。この情報は、プレイヤが見たいアクションを判断するのに役立ち、これは、パッチ中に表示するアクションを選択する、または、ゲームマッチを設計して、ユーザがマッチ中に発生することを好む状況の可能性を高めるのに役立つ。
いくつかの場合では、観客は、ゲームプレイのブロードキャストがどの程度うまく行われていると思うかについてフィードバックを提供でき、これは、表示するアクションまたはリプレイの特定の選択、選択したカメラアングル、ナレーションに含まれる情報、ナレーションの言い回し、レンダリングされたナレータの外観、またはナレーションレンダリングの発話特性と関連付けることができる。観客のフィードバックをAIが集約して使用し、幅広い視聴者にアピールするブロードキャストを生成できる。特定の観客による観客のフィードバックをAIが使用して、その特定の観客が楽しむものにより適した、その観客専用のブロードキャストを生成できる。
ゲームセッション及び/またはユーザに関連する他の入力も提供され得る。例えば、トレーニングに使用されるときに本質的に高い評価を有するか、または高い成功基準を定義し得る人間の入力314が提供され得る。例えば、人間の熟練者を使用して、熟練者によって見られる1つまたは複数のゲームセッションから観客関心ゾーンを識別するのを助け、AIの観客関心ゾーンのトレーナ310へのフィードバックとして提供することができる。ある使用例では、ゲームセッションは、ライブストリームを視聴している熟練者と一緒にライブストリーミングされてもよい。別の使用例では、熟練者は、ゲーム状態を使用して記録またはリプレイできるゲームセッションを視聴している場合がある。
いずれの場合も、熟練者は、トレーニングに使用されたときに、定義上、高い成功基準を有しているか、またはそれに変換される、好都合な関心ゾーンを能動的に選択及び/または定義することができる。いくつかの実装では、AIは、1つまたは複数の関心ゾーンのカメラアングルから複数のレンダリングを生成し、これは、ブロードキャストに含めるために選択できる選択肢として、人間の熟練者に提示される。人間の熟練者には、選択が利用可能な、人間が制御するカメラアングルからのレンダリングも提示され得る。いくつかの場合では、人間の熟練者がAIにフィードバックを提供して、AIによって提示されるレンダリングのカメラアングルに影響を与えて、ズームインやズームアウトまたはパンするなどして、異なるアングルを表示することができる。
一実施形態では、重み付けモジュール350は、ヒューマンインループ選択された関心ゾーン314及び観客が選択した関心ゾーン315として提供されるフィードバックに重みを提供する。
トレーニングされると、AI関心ゾーンモデル311は、所与の入力に対して1つまたは複数の観客関心ゾーンを識別することができる。例えば、ゲームセッション(例えば、シングルプレイヤまたはマルチプレイヤ)を提供する場合、AI関心ゾーンモデル311は、そのゲームセッション内に1つまたは複数の識別された関心ゾーン312を出力として提供する。バブルAによって示されるように、そして図3Cにさらに説明されるように、追加のアクションが取られ得る。
図3Cは、本開示の一実施形態による、関心ゾーンAIモデルによって以前に観客にとって関心があるものとして識別された関心ゾーンのシーンのカメラパースペクティブを識別するように構成できるAIカメラパースペクティブモデルによってトレーニングするためのシステムであって、識別されたカメラパースペクティブはまた、観客にとって関心があるものとして識別されている、システム300Cを示す。システム300Cは、クラウドゲームシステム210のカメラパースペクティブエンジン230内、より具体的には、クラウドゲームシステム210のAIサーバ260を利用するカメラパースペクティブエンジン230内に実装され得る。
いくつかの実施態様では、ゲームの1つまたは複数のレンダリングは、AIトレーニングされたカメラパースペクティブモデル321を使用するなど、人工知能(AI)によって生成される。一実施形態において、AIカメラパースペクティブモデル321はカメラアングルを制御して、最も関心のあるアクションをキャプチャし、アングル間をカットして、単一のビューに収まらないアクションを組み込み、様々な視点からアクションを表示できる。様々な観客のために、様々なカメラパースペクティブを有する様々なストリームを生成できる。AIカメラパースペクティブモデル321は、カメラアングルを選択して、狙撃兵と狙撃兵が狙っているターゲットの両方を示すアングルなど、疑わしいアクションの全体ビューを含めることができる。
トレーニングのために、システム300Cは、入力として、1人または複数の観客にとって関心の高い1つまたは複数の識別された観客関心ゾーン312を受信する。具体的には、AIカメラパースペクティブトレーナ320は、入力として、1つまたは複数の識別された観客関心ゾーン312を受信する。加えて、メタデータ302、プレイヤ統計303、及びAI観客関心ゾーントレーナ310に以前に提供された1つまたは複数のビデオゲームの1つまたは複数のゲームセッションからの他の情報などの他の入力データが提供されてもよく、ゲームセッションは、シングルプレイヤまたはマルチプレイヤのゲームセッションであり得る。
前述のように、AIカメラパースペクティブトレーナ320は、深層学習エンジン190を実装して、人間のプレイヤ及び/またはAIプレイヤによって実行される1つまたは複数のビデオゲームの1つまたは複数のゲームセッション中に、1つまたは複数のゲームセッションの観客ビュー中に、1つまたは複数のゲームセッションのリプレイ中に、ゲームセッションのライブナレーションまたは解説、人間の入力などを有するライブブロードキャスト中に収集された、トレーニングデータを使用して分析して、識別された関心ゾーンのシーンのレンダリングされたビューに対応するカメラパースペクティブを識別する。具体的には、深層学習エンジン190は、学習及び/またはモデリングフェーズ中に、深層学習アルゴリズム、強化学習、または他の人工知能ベースのアルゴリズムを含む人工知能を利用して、トレーニングデータ及び成功基準を使用してカメラパースペクティブモデル321を構築する。
例えば、カメラパースペクティブモデル321をトレーニングするためにフィードバックループが提供され得る。具体的には、各反復で、フィードバックループは、対応する選択された関心ゾーンの対応するシーンについて少なくとも1つのカメラパースペクティブ322を出力するときに、カメラパースペクティブトレーナ320によって使用される成功基準を精緻化するのに役立ち得る。
示されるように、トレーニングされているカメラパースペクティブモデル321を介したAIカメラパースペクティブトレーナ320は、出力323として、所与の入力のセットに対して1つまたは複数の潜在的なカメラパースペクティブを提供することができる。入力は、人間のプレイヤ及び/またはAIプレイヤによって実行される1つまたは複数のビデオゲームの1つまたは複数のゲームセッションに関連付けることができる。説明を容易にするために、フィードバックプロセスは、シングルプレイヤまたはマルチプレイヤのゲームセッションなどの1つのゲームセッションから提供されている入力のセットに関連して説明されている。加えて、ゲームセッションはライブであるか、すでに行われている可能性がある。このようにして、以前のゲームセッションに対応する履歴ゲームデータを使用して、カメラパースペクティブモデル321をトレーニングして、ゲームセッションでのアクションをフォローする方法をよりよく予測し、観客にとって関心があるもの(例えば、視聴するためのカメラパースペクティブ)を選択することができる。
前述のように、1つまたは複数の識別された観客関心ゾーンは、ライブであるか、記録されているか、またはゲーム状態データを使用してリプレイされているゲームセッションに関連付けられ得る。AIカメラパースペクティブトレーナ320は、識別された関心ゾーンのそれぞれについて1つまたは複数のカメラパースペクティブを生成するように構成される。出力323として提供されるこれらのカメラパースペクティブは、ゲームセッションでプレイヤのために生成されたビデオを撮ることなどによって、ゲームによって生成され得る。出力323として提供されるいくつかのカメラパースペクティブは、ゲームセッション内のビデオゲームによって新たに生成され得るものであり、新たなカメラパースペクティブは、AI生成され得るか、またはヒューマンインザループの熟練者(例えば、プロのブロードキャスタ)によって提案され得る。例えば、新たなカメラパースペクティブには、別のプレイヤの銃の照準内にあるターゲットキャラクタのクローズアップビューが含まれ得る。
トレーニング中に出力323として提供されるカメラパースペクティブは、さらにフィルタリングされ、AIカメラパースペクティブトレーナ320にフィードバックされて、成功基準を定義するのに役立ち得る。例えば、カメラパースペクティブは、ヒューマンインループまたは観客の能動的及び/または受動的メトリックのいずれかを介して、出力323から選択され得る。
前述のように、観客の視聴の選択は、フィルタリングを通じてどのカメラパースペクティブを選択できるかに影響する。例えば、出力323として提供されるカメラパースペクティブのそれぞれは、選択を通じて1人または複数の観客が見ることができるゲームセッションの部分に対応することができる。その選択は、観客にとって興味深いと定義された好都合なカメラパースペクティブの成功基準を定義するのに役立ち得る。例えば、観客は、(1つまたは複数のゲームセッションの)1つまたは複数の視聴選択肢から選択される、ライブゲームセッションもしくは記録されたゲームセッションの視聴、または(例えば、ゲーム状態を使用した)ゲームセッションのリプレイを、前述のように能動的に選択することができる。
例えば、図4は、本開示の一実施形態による、ゲームアプリケーションのゲームセッションのカメラパースペクティブ及び関心ゾーンを選択するように構成されたユーザインタフェース400であって、関心ゾーンAIモデル311によって観客にとって関心があると識別された1つまたは複数の観客関心ゾーン312と、それらの識別された観客関心ゾーン312に対する1つまたは複数の生成されたカメラパースペクティブ323とを含み、カメラパースペクティブはAIカメラパースペクティブモデル321を使用して観客にとって関心があるものとして識別されている、ユーザインタフェース400を示す。したがって、観客は、ゲームセッションの観客関心ゾーン(312-1、312-2、または312-3)を選択することができ、各関心ゾーンは、対応するゲーム世界の異なる部分に焦点を合わせることができる(例えば、ある関心ゾーンでプレイヤ1をフォローし、別の関心ゾーンでプレイヤ2をフォローするなど)。
関心ゾーンが選択されると、観客は対応するカメラパースペクティブを選択することができる。例えば、観客は、観客関心ゾーン312-1に対して、カメラパースペクティブ323-1A、323-1B、または323-1Cのうちの1つを選択できる。また、観客は、観客関心ゾーン312-2に対して、カメラパースペクティブ323-2A、323-2B、または323-2Cのうちの1つを選択することができる。さらに、観客は、観客関心ゾーン312-3に対して、カメラパースペクティブ323-3A、323-3B、または323-3Cのうちの1つを選択することができる。いくつかの実施態様では、観客はカメラパースペクティブを制御して、事前定義された選択肢として提示されなかったカスタムカメラパースペクティブを作成することができる。いくつかの場合では、別の観客は、その観客が制御するカスタムカメラパースペクティブを見ることもできる。
図3Bに関連して以前に説明されたのと同じアクション360は、フィルタリングを通じて、観客が選択したカメラパースペクティブ325を定義するために使用することができる。例えば、アクション360は、観客のジャンプインカウント360A、解説またはテキストフィードバックとして提供される肯定的な観客フィードバック360B、能動的または受動的な観客アクション360C、観客リプレイカウント360D、観客ストリーミングビューカウント360Eを含むことができ、出力323として提供された選択されたカメラパースペクティブの視聴中に決定される他の観客フィードバックは、観客に好都合な対応するカメラパースペクティブを定義するのに役立ち得る。
ゲームセッション及び/またはユーザに関連する他の入力も提供され得る。例えば、トレーニングに使用されるときに本質的に高い評価を有するか、または高い成功基準を定義し得る人間の入力324が提供され得る。例えば、人間の熟練者を使用して、熟練者によって見られる1つまたは複数のゲームセッションからカメラパースペクティブを識別するのを助け、AIの観客カメラパースペクティブのトレーナ320へのフィードバックとして提供することができる。すなわち、対応するパースペクティブを有するカメラ位置は、人間の熟練者によって選択可能であり得る。ある使用例では、ゲームセッションは、ライブストリームを視聴している熟練者と一緒にライブストリーミングされてもよい。
別の使用例では、熟練者は、ゲーム状態を使用して記録またはリプレイできるゲームセッションを視聴している場合がある。いずれの場合も、熟練者は、トレーニングに使用されたときに、定義上、高い成功基準を有しているか、またはそれに変換される、関心のある好都合なカメラパースペクティブを能動的に選択及び/または定義することができる。例えば、前述のユーザインタフェース400を使用して、人間の熟練者によって、対応する識別された関心ゾーンのための1つまたは複数のカメラパースペクティブを選択することができる。ユーザインタフェース400は、関心ゾーンAIモデル311によって観客にとって興味深いものとして識別された1つまたは複数の観客関心ゾーン312と、それらの識別された観客関心ゾーン312のための、AIカメラパースペクティブモデル321を使用して、観客にとって興味深いものとして識別される1つまたは複数の生成されたカメラパースペクティブ323とを含む。
一実施形態では、重み付けモジュール350は、ヒューマンインループで選択されたカメラパースペクティブ324及び観客が選択したカメラパースペクティブ325として提供されるフィードバックに重みを提供する。
トレーニングされると、AIカメラパースペクティブ321は、所与の入力に対して1つまたは複数の観客カメラパースペクティブを識別することができる。例えば、ゲームセッション(例えば、シングルプレイヤまたはマルチプレイヤ)を提供する場合、AIカメラパースペクティブモデル321は、そのゲームセッション内の対応する選択された関心ゾーンの対応するシーンについて、1つまたは複数の識別されたカメラパースペクティブ322を出力として提供する。ゲームアプリケーション内の関心ゾーンは、ゲーム世界内のビデオゲームによって生成されたシーンに対応することができ、シーンは、そのゲーム世界内の異なるカメラパースペクティブから取られた1つまたは複数のレンダリングされたビューを通して見ることができる。
例えば、ビューの複数のレンダリングは、AIカメラパースペクティブモデル321によって生成でき、これは、ゲーム世界内の固定カメラ位置、及び/または個々のプレイヤまたはチームをフォローする対応するパースペクティブを備えるカメラ位置、及び/またはアクションの様々な側面をフォローするためにAIによって制御される対応するパースペクティブを備えるカメラ位置であり得る。一例として、ゲーム世界内の識別されたカメラパースペクティブ322は、ゲームセッション中の敵の視点から取られ得る。これにより、観客は、見ているプレイヤが戦っている敵(別のプレイヤまたは生成されたゲーム)の視点からプレイヤを見ることができる。バブルBによって示されるように、そして図3Dにさらに説明されるように、追加のアクションが取られ得る。
図3Dは、本開示の一実施形態による、関心ゾーンAIモデル311によって観客にとって関心があるものとして以前に識別された関心ゾーンのシーンの解説及び/またはナレーションを生成するように構成することができるAIナレーションモデル331を使用してトレーニングするためのシステムであって、解説は、AIカメラパースペクティブモデル321によって識別されるカメラパースペクティブに合わせて調整することができる、システム300Dを示す。システム300Dは、クラウドゲームシステム210のブロードキャスタ/ナレータエンジン220内、より具体的には、クラウドゲームシステム210のAIサーバ260を利用するブロードキャスタ/ナレータエンジン220内に実装され得る。
いくつかの実施態様では、ナレーションは、人工知能によって1人または複数の観客にとって興味深いものとして以前に識別された、識別された関心ゾーンのシーンに対して生成される。ナレーションは、人間のプレイヤ及び/またはAIプレイヤによって実行される対応するゲームセッションのために収集及び/または生成されたメタデータ及びプレイヤの統計に基づいて、人工知能を使用して生成及び/または識別される統計及びファクトを使用して生成される。
すなわち、AIナレーションモデル331は、対応する選択された関心ゾーンのシーンに解説を追加することができ、シーンの解説及び/またはカメラパースペクティブは、1人または複数のユーザにストリーミングされ得る。このようにして、観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンは1人または複数の観客にストリーミングすることができ、ビューはライブゲームセッションのためにリアルタイムで提供することができ、または対応するゲームセッションのリプレイのために生成され得るものであり、リプレイは、ゲームセッション中、またはゲームセッションが終了した後にストリーミングされ得る。
トレーニングのために、システム300Dは、対応する選択された関心ゾーンの対応するシーンについて、入力として、1つまたは複数の識別されたカメラパースペクティブを受信する。具体的には、AIブロードキャスタ/ナレータトレーナ330は、入力として、1つまたは複数の識別されたカメラパースペクティブ322を受信する。例示目的のために、システム300Dは、AIによって選択された特定のカメラパースペクティブ322-Aを使用してトレーニングされ、AIを使用して識別または選択された観客関心ゾーンの対応するシーンに関連付けることができる。
加えて、AIブロードキャスタ/ナレータトレーナ330はまた、単独で、または1つまたは複数の識別されたカメラパースペクティブ322を用いて、1人または複数の観客にとって高い関心価値がある1つまたは複数の識別された観客関心ゾーン312を受信することができる。すなわち、解説及び/またはナレーションは、解説がビデオなしで、音声でストリーミングされるように、または解説がビデオを補完するものとしてストリーミングされるように、識別された関心ゾーンのシーンに基づいて生成され得る。
加えて、人工知能によって生成されたゲーム及びプレイヤの統計及びファクト342などの他の入力データをAIブロードキャスタ/ナレータトレーナ330に提供することができる。一実施態様では、ゲーム及びプレイヤの統計及びファクト342はフィルタリングされておらず、AIナレーションモデル331は、統計及びファクト342をフィルタリングして、人工知能を使用して1人または複数の観客にとって高い関心がある統計及びファクトを識別するようにトレーニングされる。
例えば、メタデータ302、プレイヤ統計303、及び以前にAI観客関心ゾーントレーナ310に提供された1つまたは複数のビデオゲームの1つまたは複数のゲームセッションからの他の情報もまた、AI統計及びファクトトレーナ340に提供され得る。このようにして、統計及びファクトトレーナ340は、深層学習エンジン190を実装して、1つまたは複数のゲームセッション中に収集されたトレーニングデータを分析し、人工知能を使用してそれらのゲームセッションに関する統計及びファクトを識別する。具体的には、深層学習エンジン190は、深層学習アルゴリズム、強化学習などの人工知能を利用して、対応するゲームセッションの統計及びファクトを識別及び/または生成するために使用される統計/ファクトモデル341を構築することができる。
例えば、AIナレーションモデル331をトレーニングするためにフィードバックループが提供され得る。具体的には、各反復で、フィードバックループは、1つまたは複数の選択された及び/または識別された統計及びファクト333を出力するときにAIブロードキャスタ/ナレータトレーナ330によって使用される成功基準を精緻化するのに役立ち得る。示されるように、トレーニングされている統計/ファクトモデル331を介したAIブロードキャスタ/ナレータトレーナ330は、所与の入力のセット(例えば、識別されたシーン及び/またはそのシーンのカメラパースペクティブ)について1つまたは複数の統計及びファクト333を出力として提供し得る。
入力は、1つまたは複数のゲームセッションに関連付けることができる。説明を容易にするために、フィードバックプロセスは、1つのゲームセッション(例えば、ライブ、記録、ゲーム状態を使用したリプレイ)から提供される入力のセットに関連して説明されている。このようにして、以前のゲームセッションに対応する履歴ゲームデータを使用して、AIナレーションモデル331をトレーニングして、ゲームセッションでのアクションをフォローする方法をよりよく予測し、対応するナレーションを作成するときに使用される、観客にとって関心があるもの(例えば、統計及びファクト)を選択することができる。
示されるように、AIブロードキャスタ/ナレータトレーナは、人工知能を使用して、ゲームセッションの統計/ファクトモデル341を使用して生成及び/または識別された統計及びファクト342のセットから統計及びファクト333を選択するように構成される。具体的には、AIブロードキャスタ/ナレータトレーナ330は、人工知能を使用して、1人または複数の観客にとって高い関心がある統計及びファクトを識別するように構成される。このようにして、AIブロードキャスタ/ナレータトレーナ330は、深層学習エンジン190を実装して、1つまたは複数のゲームセッション中、ライブまたは録画またはリプレイされたゲームセッションの観客ビュー中に収集されたトレーニングデータ、ゲームセッションのライブナレーション、人間の入力を分析して、観客にとって高い関心がある統計及びファクトを識別する。
具体的には、深層学習エンジン190は、AIナレーションモデル331を構築するために、深層学習アルゴリズム、強化学習などの人工知能を利用することができる。このようにして、入力のセット(例えば、対応するシーン及び/または対応するカメラパースペクティブを有する選択された観客関心ゾーン)が与えられると、AIナレーションモデル331は、1人または複数の観客にとって高い関心がある出力331として提供されるゲーム及びプレイヤの統計及びファクトを出力するように構成され、これは、トレーニングのために、またはナレーション332を構築するために使用できる。
出力333として提供される選択された統計及びファクトは、成功基準を定義するのを助けるために、さらにフィルタリングされ、フィードバックとして提供され得る。例えば、統計及びファクトは、ヒューマンインループまたは観客の能動的及び/または受動的メトリックのいずれかを介して、出力333から選択され得る。つまり、フィルタリングは、熟練者が選択した統計及びファクト333Aと、観客のアクションによって強化されるAIが選択した統計及びファクト333Bとを定義することができる。
前述のように、観客の視聴の選択は、フィルタリングを通じてどのカメラパースペクティブを選択できるかに影響する。例えば、出力333として提供される統計及びファクトは、選択を通じて1人または複数の観客が見ることができるゲームセッションの部分に対応することができる。その選択は、観客にとって興味深いと定義された好都合な統計及びファクトの成功基準を定義するのに役立ち得る。例えば、観客は、(1つまたは複数のゲームセッションの)1つまたは複数の視聴選択肢から選択される、ライブゲームセッションもしくは記録されたゲームセッションの視聴、または(例えば、ゲーム状態を使用した)ゲームセッションのリプレイを、前述のように能動的に選択することができる。
選択されたビューは、AIが選択した統計及びファクト333Bを定義するのに役立ち得る固有の統計及びファクトにも対応している。加えて、観客によるアクション(例えば、ジャンプインカウント360A、肯定的な観客フィードバック360B、能動的または受動的な観客アクション360C、リプレイカウント360D、ストリーミングビューカウント360Eなど)を使用して、人工知能によって選択された統計及びファクト333Bを定義できる。例えば、1人または複数の観客が選択を通じて見ることができるゲームセッションの部分に関連する統計及びファクトは、見られるゲームセッションも観客にとって高い関心があると識別されるので、観客にとって高い関心があると定義することができる。
ゲームセッション及び/またはユーザに関連する他の入力も提供され得る。例えば、トレーニングに使用されるときに本質的に高い評価を有するか、または高い成功基準を定義し得る人間の入力が提供され得る。例えば、人間の熟練者を使用して、熟練者によって見られる1つまたは複数のゲームセッションから統計及びファクト333Aを識別するのを助け、AIブロードキャスタ/ナレータトレーナ330へのフィードバックとして提供することができる。すなわち、出力333として提供される特定の統計及びファクトは、ライブストリーミング、または記録されたゲームセッション、またはゲーム状態を使用してリプレイされたゲームセッションであり得る対応するゲームセッションを視聴する人間の熟練者によって選択可能であり得る。このようにして、熟練者は、トレーニングに使用されたときに、定義上、高い成功基準を有しているか、またはそれに変換される好都合な統計及びファクトを能動的に選択及び/または定義することができる。
一実施形態では、重み付けモジュール350は、ヒューマンインループで選択された統計及びファクト333A及びAIが生成し、観客が強化した統計及びファクト333Bとして提供されるフィードバックに重みを提供する。
一実施形態では、AIナレーションモデル331を構築するために使用されるフィルタリングされた統計及びファクトは、AIゲーム及びプレイヤ統計及びファクトトレーナ340に送信され得る。このようにして、トレーニングされた統計/ファクトモデル341はまた、1人または複数の観客にとって高い関心がある統計及びファクトを識別するように構成され得る。このようにして、特定のゲームセッションの全ての統計及びファクトを出力する代わりに、統計/ファクトモデル341は、一実施形態では、それらの統計及びファクトをフィルタリングして、観客にとって高い関心がある統計及びファクトのみを出力するように構成される。
一実施形態では、熟練者が選択した統計及びファクト33Aは、熟練者によって提供されるライブナレーション334から収集される。すなわち、ライブナレーション334は、熟練者が選択した統計及びファクト333Aを含み、これらは、1つの実施態様では解析することができ、または別の実施態様では熟練者による能動的選択を通じて提供することができる。ライブナレーションはまた、フィードバックとしてブロードキャスタ/ナレータトレーナ330に提供され得るものであり、1人または複数の観客にとって高い関心がある対応する熟練者が選択したファクトを用いてナレーションのタイプ(例えば、テンプレートを構築するために使用される)を識別するのを助けることができ、このフィードバックはナレーションの生成に使用されるテンプレートを作成するために使用できる。
別の実施形態では、AIが選択した統計及びファクト333Bを使用して、AIが生成したナレーション335を構築する。例えば、ナレーション335は、AIが選択した統計及びファクト333Bに織り込まれている解説テンプレート338を使用して構築され得る。観客アクション360は、どの解説テンプレートが観客にとって最も興味深いかを選択するのを助けるために使用され得る。各テンプレートは、1人の観客に個人的なテンプレートや、観客のグループのスタイルを有するテンプレートなど、1人または複数の観客が好む特定のスタイルを反映することができる。
別の実施形態では、AIが生成したナレーション335は、文化及び/または言語、ならびに他のフィルタによってさらにフィルタリングされ得る。例えば、人工知能によって生成されたナレーション335は、言語フィルタ337を使用して特定の言語用にフォーマットされ得る。このようにして、単一のシーン及び/またはシーンのカメラパースペクティブは、1つまたは複数の言語にフォーマットされた1つまたは複数のナレーション335を通じてサポートされ得る。さらに、ナレーション335は、文化的フィルタ336を使用して、文化的特徴(例えば、感受性、選好、好みなど)についてさらにフィルタリングされ得る。文化的特徴は、特定の地理的地域(例えば、国、州、国境など)に対して定義できる。
例えば、異なる文化的特徴は、ある文化的特徴のシーンのオブジェクトまたは関連トピックを無視し、別の文化的特徴のオブジェクトまたは関連トピックに正面から取り組むなど、様々な方法でシーンを説明する場合がある。一部の文化的特徴は興奮しやすい解説を好むかもしれないが、他の文化的特徴はより控えめな解説を好むかもしれない。このようにして、AIが生成したナレーション及び/または解説335は、文化及び言語にさらにカスタマイズされた適切なテンプレート338を使用して生成され得る。いくつかの実施形態では、AIが生成したナレーション及び/または解説335は、特定の観客または観客のグループに対してさらにパーソナライズすることができ、文化的フィルタ336は、観客または観客のグループに特定のフィルタリングを適用するように設計される。このようにして、AIナレーションモデル331は、文化的及び性別の考慮を勘案した異なる言語での解説を含む、複数の場所の視聴者にローカライズされた1つまたは複数のストリームを生成するように構成される。
一実施形態では、重み付けモジュール350は、ヒューマンインループライブナレーション334及びAIが生成したナレーション335として提供されるフィードバックに重みを提供する。いくつかの実施形態では、ブロードキャストは、1人または複数の人間のナレータ及び1つまたは複数のAIナレータの両方によるナレーションを含む。AIナレータは、何を言うかを決定するときに、人間のナレータが言ったことを組み込むことができる。
いくつかの場合では、イベントのブロードキャストのAIナレータは、何を言うかを決定するときに、同じイベントの別のブロードキャストで人間のナレータが言ったことを組み込むことができる。いくつかの実施態様では、AIナレータは、何を言うかを決定するときに、1人または複数のナレータ及び/または1人または複数の観客によって言われたことを組み込むことができ、この場合組み込まれた発言はブロードキャストに含まれていない。発言には、ブロードキャストシステム、またはソーシャルメディアなどの他のチャネルを介してアクセスできる。いくつかの場合では、発言は、絵文字、いいね、共有、またはお気に入りなど、非言語的なものであることがある。
トレーニングされると、AIナレーションモデル331は、所与の入力に対してAIが選択した統計及びファクトを使用してナレーション332を構築するように構成される。例えば、ゲームセッション(例えば、シングルプレイヤまたはマルチプレイヤ)を対応するデータ(例えば、メタデータ、プレイヤ統計など)とともに提供する場合、AIナレーションモデル331は、出力として(1人または複数の観客に適用される)言語及び/または文化的特性についてさらにフィルタリングされ得るナレーション332を提供する。すなわち、AIナレーションモデル331は、文化的フィルタ336、言語フィルタ337、及び解説テンプレート338を含むか、またはそれらにアクセスすることができる。
いくつかの実施形態では、AIが生成した解説及び/またはナレーション332は、説得力のある個性を有する。例えば、AIナレーションモデルは、観客にストリーミングされたビューが重要である理由を観客に伝えることができる統計及びファクトを選択するように構成できる。これは、適切な解説テンプレート338を選択することで実装できる。例えば、AIが生成した解説及び/またはナレーション332は、新規または低レベルのプレイヤが経験豊富なプレイヤをキルする位置(特定の関心ゾーン)にあるという通知を提供することができる。このようにして、新しいプレイヤが実際に状況を利用してより経験豊富なプレイヤをキルすることができるかどうかを確認するためにシーンを見るように観客の気を引くために、観客に通知を提供することができる。
他の実施形態では、AIボイスオーバーは、ナレーション及び/または解説332として提供され得る。一実施形態では、ボイスオーバーは、視覚障害のある観客にとって理解可能でエキサイティングであるように、eスポーツゲームのアクションを説明することができる。別の実施形態では、ボイスオーバーは、スタンドアロンであるか、またはイベントのビューを提供され得るイベントに対する実況解説として提供される。
ネットワークを介して通信するゲームサーバとクライアントデバイスの様々なモジュールの詳細な説明により、本開示の一実施形態による、1つまたは複数のAIモデルを使用して、観客にとって関心がある可能性のある観客関心ゾーンのカメラパースペクティブを識別する方法を、図5の流れ図500に関連してここで説明する。具体的には、流れ図500は、人工知能によってゲームの1つまたは複数のレンダリングを生成するためのバックエンドAIサーバに含まれる操作のプロセス及びデータフローを示し、レンダリングは1人または複数の観客にストリーミングされ得る。例えば、流れ図500の方法は、少なくとも部分的に、図1A、2、3A及び3Cの、クラウドゲームサーバ210にあるカメラパースペクティブエンジン230によって実行され得る。
510において、本方法は、ビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。ゲームセッションは、シングルプレイヤセッションまたはマルチプレイヤセッションであり得る。ゲーム状態とユーザデータを部分的に含むメタデータは、ゲームセッションに関連してクラウドゲームサーバで受信される。ゲームセッションに参加している1人または複数のプレイヤのユーザデータを受信する場合がある。
例えば、ゲーム状態データは、ゲームプレイにおける対応するポイントでのゲームプレイの状態を定義することができる(例えば、ゲーム状態データは、ゲームキャラクタ、ゲームオブジェクト、オブジェクト属性、グラフィックオーバーレイ、キャラクタのアセット、キャラクタのスキルセット、キャラクタについてのゲームアプリケーション内のタスク達成の履歴、ゲーム内環境のキャラクタの現在の地理的位置、キャラクタのゲームプレイの現在のステータスなどを含む)。
ゲーム状態は、ゲームプレイの対応するポイントに存在したゲーム内環境(例えば、仮想ゲーム世界)の生成を可能にし得る。ユーザセーブデータは、対応するユーザ(例えば、プレイヤ)についてゲームアプリケーションをパーソナライズするために使用することができ、データは、ゲームプレイにおいてキャラクタをパーソナライズする情報(例えば、体型、外観、衣服、武器、ゲーム難易度、ゲームレベル、キャラクタ属性など)を含むことができる。他の情報は、前述されるような、ゲーム状態に関連し得るランダムシードデータを含むことができる。
520で、本方法は、ゲームセッションにおける観客関心ゾーンを識別することを含む。観客関心ゾーンは、ビデオゲームの仮想ゲーム世界のシーンに関連付けられている。例えば、シーンは、特定の場所にある、またはキャラクタの一般的な近傍内にある仮想ゲーム世界を含むことができ、シーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができる。例えば、カメラパースペクティブには、キャラクタの視点からのビュー、別のプレイヤからのビュー、シーンのトップダウンビュー、シーンのオブジェクトまたはエリアのクローズアップビュー、照準ビューなどが含まれ得る。
一実施形態では、観客関心ゾーンは、人工知能によって識別され得る。具体的には、より多くの観客関心ゾーンは、前述のように、1人または複数の観客によって見られる可能性が高い1つまたは複数の観客関心ゾーンを分離するようにトレーニングされたAIモデル(例えば、関心ゾーンモデル311)を使用して識別され得る。例えば、関心ゾーンは、人気のあるプレイヤがゲームセッションに参加したとき、または2人の熟練者プレイヤがゲーム世界で互いに一定の地理的な距離内におり、会う可能性が高いときなどを示す。それぞれの識別された関心ゾーンは、ゲームセッションの仮想ゲーム世界の対応するシーンに関連付けられている。一実施形態では、第1の観客関心ゾーンは、潜在的な観客の関心について最高の評価を有し得るもので、第1のシーンに関連付けられ得る(例えば、最も人気のあるプロのプレイヤをフォローする)。シーン内で、1人のプレイヤからのビュー、または第2のプレイヤからのビュー、トップダウンビュー、クローズアップビュー、照準ビューなど、1つまたは複数のカメラパースペクティブを生成できる。
別の実施形態では、観客関心ゾーンは、観客の入力によって識別され得る。例えば、観客は注目する関心ゾーンを能動的に選択することができる。例として、選択された関心ゾーンは、ゲームセッションにおける特定のプレイヤのためのゲームアクションを含み得る。別の例として、選択された関心ゾーンは、仮想ゲーム世界の特定の部分とインタラクトする1人または複数のプレイヤのゲームアクションを含み得る。それぞれの選択及び識別された関心ゾーンは、ゲームセッションの仮想ゲーム世界の対応するシーンに関連付けられている。シーン内で、1人のプレイヤからのビュー、または第2のプレイヤからのビュー、トップダウンビュー、クローズアップビュー、照準ビューなど、1つまたは複数のカメラパースペクティブを生成できる。
530で、本方法は、観客関心ゾーンの第1のカメラパースペクティブを識別することを含む。第1のカメラパースペクティブは、対応する観客関心ゾーンの1つまたは複数のカメラパースペクティブを生成するようにトレーニングされたAIモデル(例えば、カメラパースペクティブモデル321)を使用して識別される。第1のカメラパースペクティブは、1人または複数の観客にとって最も高い潜在的関心(例えば、最も高い評価)を有すると決定され得る。例えば、第1のカメラパースペクティブは、熟練者であるプレイヤからのビューを示し、熟練者は自分の照準内にターゲットを入れることができる。このようにして、第1のカメラパースペクティブが識別され、ネットワークによって1人または複数の観客にストリーミングされ得るものであり、ストリーミングされたコンテンツは、人工知能によって1人または複数の観客にとって高い関心があると判断されたビュー(例えば、カメラパースペクティブ)を含む。
一実施形態では、ストリームは、シーンの1つまたは複数のカメラパースペクティブを含み得る。例えば、シーンは、銃の照準内にターゲットを入れている熟練者であるプレイヤを中心に展開する場合がある。ストリームは、シーンの様々なカメラパースペクティブを示すことができ、例えば、熟練者プレイヤのビューからの1つのパースペクティブ、ターゲットプレイヤ(例えば、無意識のうちにターゲット)のパースペクティブからの別のビュー、さらに照準器を通したターゲットのクローズアップビューを含む別のビューなどである。
例えば、第2のカメラパースペクティブは、対応する観客関心ゾーンの1つまたは複数のカメラパースペクティブを生成するようにトレーニングされたAIモデルに基づいて、シーンに対して識別及び生成され得る。第2のカメラパースペクティブは、すでにゲーム生成されていてもよく(例えば、ゲームセッションにおけるプレイヤの現在のゲームプレイのために)、またはゲーム状態を使用して新たに生成され、実行中のビデオゲームによって以前に生成されていなくてもよい(例えば、照準のカメラパースペクティブ、または両方のプレイヤを示すトップダウンパースペクティブ)。このようにして、ストリーミングされたコンテンツには、同じシーンの様々なビューが含まれ得る。
別の実施形態では、第1及び第2のカメラパースペクティブは、異なるストリームに対して生成される。例えば、第1のカメラパースペクティブは、ネットワークを介して1人または複数の観客の第1のグループに送信される第1のストリームに対して生成され得る。1つの使用例では、第1のカメラパースペクティブは、第1のプロのプレイヤをフォローすることができ、観客の第1のグループは、第1のストリームにおいて第1のプロのプレイヤをフォローすることを望む。第2のカメラパースペクティブは、第2のプロのプレイヤをフォローすることができ、観客の第2のグループは、第2のストリームにおいて第2のプロのプレイヤをフォローすることを望むことができる。両方のストリームをネットワーク経由で同時に配信して、同じシーンの様々なビューを異なる観客グループに提供できる。
一実施形態では、第1のカメラパースペクティブは、ゲームセッションのハイライトをストリーミングする目的で識別され、ゲームセッションは、ゲームセッション中にハイライトが表示されてライブであってもよく、またはゲームセッションが終了していてもよく、記録を通して見られているか、またはゲーム状態を使用してリプレイされている。ハイライトには、ゲームセッション中に発生した以前のゲームプレイの関心ゾーンによって識別される興味深いシーン(例えば、イベントのシーン)が含まれ得る。カメラパースペクティブは、ゲームセッションのプレイヤのためなど、ビデオゲームによって以前に生成されたものである場合もあれば、1人または複数の観客にとって非常に興味深いと識別された視点から人工知能によって新たに生成されてもよい。
一実施形態では、シーンのナレーションは、対応する観客関心ゾーンの対応するシーンのナレーションを、それらの関心ゾーン(例えば、最も人気のあるプロのプレイヤをフォローする)に関連する統計及びファクトを使用して構築するようにトレーニングされるAIモデル(例えば、AIブロードキャスト/ナレーションモデル331)に基づいて生成される。統計及びファクトは、人工知能によって選択され得るものであり、図6に関連して以下により完全に説明されるように、ナレーション及び/または解説を構築するために使用され得る。
ネットワークを介して通信するゲームサーバ及びクライアントデバイスの様々なモジュールの詳細な説明とともに、本開示の一実施形態による、1つまたは複数のAIモデルを使用して、観客にとって興味深いと識別される観客関心ゾーンのシーンのナレーションを構築及び/または生成するための方法であって、ナレーションが人工知能によって識別されたシーンの1つまたは複数のカメラパースペクティブに合わせて調整され得る、方法が、図6の流れ図600に関連してここで説明される。具体的には、流れ図600は、人工知能によってゲームの1つまたは複数のレンダリングを生成するためのバックエンドAIサーバに含まれる操作のプロセス及びデータフローを示し、レンダリングは1人または複数の観客にストリーミングされ得る。例えば、流れ図600の方法は、少なくとも部分的に、図1A、2、3A及び3Dの、クラウドゲームサーバ210のブロードキャスタ/ナレータエンジン220によって実行され得る。
610で、本方法は、シングルプレイヤまたはマルチプレイヤセッションに参加している1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信することを含む。前述のように、ゲーム状態とユーザデータを部分的に含むメタデータは、ゲームセッションに関連してクラウドゲームサーバで受信される。ゲームセッションに参加している1人または複数のプレイヤのユーザデータを受信する場合がある。
例えば、ゲーム状態データは、ゲームプレイにおける対応するポイントでのゲームプレイの状態を定義することができる(例えば、ゲーム状態データは、ゲームキャラクタ、ゲームオブジェクト、オブジェクト属性、グラフィックオーバーレイ、キャラクタのアセット、キャラクタのスキルセット、キャラクタについてのゲームアプリケーション内のタスク達成の履歴、ゲーム内環境のキャラクタの現在の地理的位置、キャラクタのゲームプレイの現在のステータスなどを含む)。
ゲーム状態は、ゲームプレイの対応するポイントに存在したゲーム内環境(例えば、仮想ゲーム世界)の生成を可能にし得る。ユーザセーブデータは、対応するユーザ(例えば、プレイヤ)についてゲームアプリケーションをパーソナライズするために使用することができ、データは、ゲームプレイにおいてキャラクタをパーソナライズする情報(例えば、体型、外観、衣服、武器、ゲーム難易度、ゲームレベル、キャラクタ属性、背景サウンドなど)を含むことができる。他の情報は、前述のように、ゲーム状態に関連し得るランダムシードデータを含むことができる。
620で、本方法は、ゲームセッションにおける観客関心ゾーンを識別することを含む。観客関心ゾーンは、ビデオゲームの仮想ゲーム世界のシーンに関連付けられている。例えば、シーンは、特定の場所にある、またはキャラクタの一般的な近傍内にある仮想ゲーム世界を含むことができ、シーンは、仮想ゲームの世界の1つまたは複数のカメラパースペクティブから見ることができる。例えば、カメラパースペクティブには、キャラクタの視点からのビュー、別のプレイヤからのビュー、シーンのトップダウンビュー、シーンのオブジェクトまたはエリアのクローズアップビュー、照準ビューなどが含まれ得る。
一実施形態では、観客関心ゾーンは、人工知能によって識別され得る。具体的には、観客関心ゾーンは、1人または複数の観客によって見られる可能性が高い1つまたは複数の観客関心ゾーンを分離するようにトレーニングされたAIモデル(例えば、関心ゾーンモデル311)を使用して識別され得る。例えば、関心ゾーンは、人気のあるプレイヤがゲームセッションに参加したとき、または2人の熟練者プレイヤがゲーム世界で互いに一定の地理的な距離内におり、会う可能性が高いとき、または多くのアクション(例えば、プレイヤの失敗、キャラクタの事故、キャラクタの死亡など)が見られる仮想ゲーム世界内の領域を識別するときなどを示す。それぞれの識別された関心ゾーンは、ゲームセッションの仮想ゲーム世界の対応するシーンに関連付けられている。シーン内で、1人のプレイヤからのビュー、または2人目のプレイヤからのビュー、トップダウンビュー、クローズアップビュー、照準ビューなど、1つまたは複数のカメラパースペクティブを生成できる。例えば、第1の観客関心ゾーンは、仮想ゲーム世界の第1のシーンに関連付けることができる。
別の実施形態では、観客関心ゾーンは、観客の入力によって識別され得る。例えば、観客は注目する関心ゾーンを能動的に選択することができる。例として、選択された関心ゾーンは、ゲームセッションにおける特定のプレイヤのためのゲームアクションを含み得る。別の例として、選択された関心ゾーンは、仮想ゲーム世界の特定の部分とインタラクトする1人または複数のプレイヤのゲームアクションを含み得る。それぞれの選択及び識別された関心ゾーンは、ゲームセッションの仮想ゲーム世界の対応するシーンに関連付けられている。
シーン内で、1人のプレイヤからのビュー、または第2のプレイヤからのビュー、トップダウンビュー、クローズアップビュー、照準ビューなど、1つまたは複数のカメラパースペクティブを生成できる。加えて、観客は、選択された関心ゾーンのビュー内に付随するナレーション(例えば、ブロードキャスト)を含めることを望む場合があり、ナレーションは、以下でより完全に説明されるように、人工知能を使用して生成され得る。
630で、本方法は、ゲーム状態データとユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされたAIモデル(例えば、統計/ファクトモデル341及び/またはAIナレーションモデル331)を使用して、ゲームセッションの統計及びファクトを生成することを含む。分離されたゲーム状態データとユーザデータは、人工知能によって統計及びファクトを生成するために変換または使用され得る。具体的には、統計及びファクトは、対応する識別された関心ゾーン、その関心ゾーンに関連付けられたシーン、及び場合によってはそのシーンの1つまたは複数の識別されたカメラパースペクティブに関連する。加えて、AIモデルは、人工知能によって決定された、1人または複数の観客にとって高い関心があるファクトと統計を識別するように構成されている。
640で、本方法は、シーンについて以前に識別された統計及びファクトを選択するようにトレーニングされた別のAIモデル(例えば、AIナレーションモデル331)を使用して、観客関心ゾーンのシーンのナレーションを生成することを含む。別の実施態様では、統計及びファクトを選択するようにトレーニングされたAIモデルはフィルタリングを実行せず、これは、1人または複数の観客が関心を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた以前に識別されたAIモデルも、人工知能を使用して1人または複数の観客が関心を持つ可能性の高い統計及びファクトを生成するようにトレーニングされ得るからである。
1つの実施態様では、統計及びファクトを選択するようにトレーニングされたAIモデルが、ナレーションに使用される統計及びファクトをさらにフィルタリングする。つまり、AIモデルは、1人または複数の観客にとって関心がある可能性の高いゲーム状態データとユーザデータを分離するようにトレーニングされたAIモデルを使用して生成された統計及びファクトから、統計及びファクトを選択するようにトレーニングされ、選択された統計及びファクトは、統計及びファクトを選択するようにトレーニングされたAIモデルによって決定されるように観客の関心が最も高い可能性がある。
加えて、統計及びファクトを選択するようにトレーニングされたAIモデルは、選択された統計及びファクトを使用してナレーション及び/または解説を生成するように構成されている。一実施形態では、ナレーションは、シーンに適切なテンプレートを使用して生成される。テンプレートは、ビデオゲームのビデオゲームタイプ、または第1の観客関心ゾーンの関心ゾーンタイプに基づくことができる(すなわち、関心ゾーンは、特定のテンプレートに対応する特定のシーンまたはシナリオを定義する)。いくつかの実施形態では、テンプレートは、AIが生成したナレーションでシーンを視聴している、対象とされた、または要求している観客のグループを考慮に入れる。例えば、テンプレートは、観客のグループが好む解説のスタイル(例えば、興奮する、または落ち着いているなど)を考慮することができる。
他の実施形態では、ナレーションに対してさらなるフィルタリングが実行される。例えば、対象となる観客グループの文化的慣習を考慮して、ナレーションをフィルタリングすることができる。例えば、グループ、及びグループに関連付けられている地理的地域によっては、前述のように、ナレーションの作成方法を決定する文化的な選好が存在する場合がある。例えば、あるグループはシーンのトピックのナレーションを含むのを問題としないが、別のグループはそのトピックをナレーションに含めることに反対する。
いくつかの実施形態では、フィルタリングは、通信フォーマットフィルタを適用することができ、通信フォーマットは音声言語、非音声言語(手話)などであり得る。例えば、フィルタリングは、言語フィルタを適用することができ、ナレーションは、観客のグループが好む特定の言語に対して生成されるようにする。いくつかの実施形態では、非音声言語にフィルタを適用する場合、フィルタリングされた慣習は、性別、手話の異形、地理的位置などを考慮した正しい表現を反映する必要がある。
一実施形態では、1つまたは複数のフィルタを考慮に入れて、同じシーンを観客の異なるグループにストリーミングすることができる。例えば、観客の第1のグループ及び/または第1の地理的領域の1つまたは複数の第1の慣習に合わせて調整されたシーンの第1のナレーションを生成することができ、第1のナレーションは、第1のグループが好む第1の言語で生成される。加えて、観客の第2グループ及び/または第2の地理的地域の1つまたは複数の第2の慣習に合わせて調整された同じシーンの第2のナレーションを生成することができ、第2のナレーションは、第2のグループが好む第2の言語で生成される。
一実施形態では、ナレーションは、観客のグループにもストリーミングされる対応するカメラパースペクティブに合わせて調整することができる。このようにして、ナレーションは、ストリーミングされる可能性もあるレンダリングされたビューを厳密にフォローすることができる。例えば、ナレーションは、第1のプレイヤの視点から取得されたシーンの第1のパースペクティブから移動し、次に、ナレーションがコンテンツにシフトして、観客のグループにストリーミングされているシーンの第2のパースペクティブを中心に回転することができる。そのため、シーンのストリーミングカメラパースペクティブとAIが生成したナレーションの間には良好な関係がある。
一実施形態では、ナレーションは、ゲームセッションのハイライトをストリーミングする目的で生成され、ゲームセッションは、ゲームセッション中にハイライトが表示されてライブであってもよく、またはゲームセッションが終了していてもよく、記録を通して見られているか、またはゲーム状態を使用してリプレイされている。ハイライトには、ゲームセッション中に発生した以前のゲームプレイの関心ゾーンによって識別される興味深いシーン(例えば、イベントのシーン)が含まれ得る。
カメラパースペクティブは、ゲームセッションのプレイヤのためなど、ビデオゲームによって以前に生成されたものである場合もあれば、1人または複数の観客にとって非常に興味深いと識別された視点から人工知能によって新たに生成されてもよい。加えて、ナレーションはストリーミングハイライト用に構築されており、シーンとシーン用にストリーミングされているカメラパースペクティブに合わせて調整することができ、ナレーションには、人工知能によって1人または複数の観客にとって高い関心があると識別される統計及びファクトが含まれる。このようにして、トラフィックの少ないゲームセッションでも、人工知能を使用して生成及び識別された興味深い統計及びファクトを含むAIナレーションを含むハイライトを有し得る。
図7は、本開示の実施形態による、ゲームアプリケーションをプレイする1人または複数のプレイヤを含むゲームセッションのハイライトリールの生成を示し、ハイライトリールは、複数のゲームアプリケーションの複数のゲームセッションにおける観客関心ゾーンを識別できるAIモデルを使用して生成されて、それらの識別された観客関心ゾーンの関心があるカメラパースペクティブを識別し、それらの識別された観客関心ゾーンのシーンに対するナレーションを提供する。図7に示すプロセスフローは、ハイライトエンジン240によって部分的に実装され得る。
具体的には、ハイライトリールは、ライブであるゲームセッション(例えば、ゲームセッション中にハイライトを提供する)、または終了したゲームセッションのために生成され得るものであり、ハイライトリールは、ゲームセッションの記録から、または、ゲーム状態を使用したゲームセッションのリプレイから生成され得る。
そのため、ゲームセッションが終了した後、ハイライトカバレッジが利用可能となり得る。ハイライトによるこのようなカバレッジは、前述のように、AIの選択に基づいて自動的に生成できる。例えば、関心ゾーン、カメラパースペクティブ、統計及びファクトを含むハイライトカバレッジは、観客がゲームセッションを視聴するときに視聴または巻き戻しを選択することに基づいていてもよい。例えば、ハイライトカバレッジには、ゲームセッションのプレイヤが誰も排除されないニアミスが含まれ得るが、観客にとっては見るのが非常にエキサイティングである。
加えて、ハイライトカバレッジには、ライブで表示されなかったシーンのリプレイ、またはゲームセッション中に生成されなかった可能性のある対応するシーンのカメラパースペクティブのリプレイが含まれ得る。例えば、ハイライトカバレッジは、ライブで表示されなかったマルチプレイヤゲームセッションのプレイヤの興味深い排除を示すことができる。または、ハイライトカバレッジは、観客に非常に人気があるかもしれないが、ゲームセッション中に生成されなかったカメラパースペクティブを示すことができる。例えば、ライブで表示されたプレイヤの排除では、新たなトップダウンカメラパースペクティブが新たに生成され、シューイングプレイヤと排除されたプレイヤのビューが1つのビューに表示され得る。
一実施形態では、ゲームセッションのハイライトカバレッジは、ゲーム自体よりも長く続くことができ、ゲームセッションは、試合(例えば、直接対決、最後のプレイヤ立ち位置など)のためのものである。いくつかの実施態様では、試合またはゲームセッションの早い段階での排除のハイライトカバレッジは、ゲームセッションの終了後に継続し得る。例えば、ゲームセッションのステータスがリアルタイムで利用できない状況では、ゲームセッションのカバレッジを拡張して、各排除を表示でき、これにより、ゲームセッションのライブブロードキャストが対応する試合期間を超えて延長され得る。
図7に示すように、ゲームセッションにおけるプレイヤ1~Nのメタデータ702及びプレイヤ統計は、今は関心ゾーンモデル311を適用するように構成されている、AI観客関心ゾーントレーナ310に配信される。例えば、トレーナ310は、AIサーバ260として、またはAIサーバ260内に実装され得る。関心ゾーンモデル311は、1人または複数の観客にとって高い関心がある1つまたは複数の観客関心ゾーンを生成及び/または識別するように構成されている。例えば、関心ゾーンは、非常に人気のあるプロのプレイヤをフォローすることができ、その結果、1人または複数の観客は、ゲームセッション中またはハイライトを視聴するときにプロのプレイヤのビューをストリーミングすることを望む場合がある。
識別された関心ゾーンは、カメラパースペクティブモデル321を適用するように今は構成されているAIカメラパースペクティブトレーナ320への入力として提供され得る。例えば、トレーナ320は、AIサーバ260として、またはAIサーバ260内に実装され得る。カメラパースペクティブモデル321は、対応する関心ゾーンについて1つまたは複数のカメラパースペクティブを生成するように構成されている。カメラパースペクティブは、ゲームセッション中にビデオゲームによって生成されたものであってもよく、または、以前は表示されなかったが観客にとって高い関心があるレンダリングされたビューをキャプチャするために新たに生成されたもの(例えば、射撃しているプレイヤ及び排除されたプレイヤを示すトップダウンビュー)であってもよい。
識別された及び/または生成されたカメラパースペクティブは、ブロードキャスト/ナレーションモデル331を適用するように今は構成されているAIナレーショントレーナ330への入力として提供される。例えば、トレーナ330は、AIサーバ260として、またはAIサーバ260内に実装され得る。ブロードキャスト/ナレーションモデル331は、対応する識別された関心ゾーンのシーンのナレーションを生成するように構成されている。具体的には、ブロードキャスト/ナレーションモデル331は、人工知能によってゲームセッションのシーンに関連する統計及びファクトを選択するように構成されている。
一実施形態では、統計及びファクトは、ゲームセッションのメタデータ及びプレイヤ統計に基づいて生成された統計及びファクトのグループから選択される。例えば、ゲームセッションにおけるプレイヤ1~Nのメタデータ702及びプレイヤ統計は、AIゲーム及びプレイヤ統計及びファクトトレーナ340に配信され、これは、統計/ファクトモデル341を適用して、そのゲームセッションのための全ての統計及びファクトを生成するように構成されている。例えば、トレーナ340は、AIサーバ260として、またはAIサーバ260内に実装され得る。
一実施形態では、統計/ファクトモデル341及び/またはナレーションモデル331は、単独でまたは組み合わせて、1人または複数の観客にとって高い関心がある対応する関心ゾーンの対応するシーンの統計及びファクトを識別及び/または生成するように構成される。このようにして、選択された統計及びファクトを使用して、人工知能を使用したナレーション335を生成することができる。
例えば、AIが選択した統計及びファクトは、ナレーション335を生成するために適切なテンプレートに織り込むことができ、テンプレートは、見られている特定のシーンに向けられ得るか、または対象となる観客に向けられ得る(例えば、興奮するナレーションの選好)。加えて、1つまたは複数のフィルタリングプロセスをナレーション335に対して実行することができる。例えば、文化的フィルタをナレーションに適用することができ、文化的フィルタは、対象となる観客に適用可能である。加えて、言語フィルタをナレーション335に適用して、解説及び/またはナレーション335を好ましい言語で提供するようにできる。
示されているように、ハイライトリールジェネレータは、AIが生成したナレーションとともに、ゲームセッションの識別された関心ゾーンのシーンのレンダリングされたビューをパッケージ化することができる。ハイライトリールは、ネットワーク150を介して1人または複数の観客720にストリーミングされ得る。このようにして、1人または複数の観客720は、観客の最大の関心を生み出すために構築されたナレーションでサポートされる特定のゲームセッションの最もエキサイティングなシーンを見ることができ、ビューはライブゲームセッションのためにリアルタイムで提供することができ、または対応するゲームセッションのリプレイのために生成され得るものであり、リプレイは、ゲームセッション中、またはゲームセッションが終了した後にストリーミングされ得る。
一実施形態では、第2のハイライトリールは、ゲームセッションの別の第1のハイライトリールから生成され得る。すなわち、第1のハイライトリールは、ハイライトエンジン240への入力として提供され、第2のハイライトリールは、出力として生成される。すなわち、リプレイの1つまたは複数のレンダリング(例えば、ハイライトリール)を、他の観客が視聴できるようにすることができる。加えて、他の後続のハイライトリールが第2のハイライトリールから生成され得るものであり、その結果、ハイライトリールのチェーンが生成され得る。
一実施形態では、ゲームセッションのレンダリングされたビューまたはゲームセッションのハイライトリールは、マルチプレイヤゲームセッションが視聴者の前で、ライブで実行されるeスポーツイベントなどのライブイベントのコンテキスト内で提供され得る。具体的には、複数の観客が、複数の観客が見ることができるように設定された1つまたは複数のディスプレイがある共通の場所(eスポーツアリーナなど)でライブイベントを見ることができる。加えて、観客は、複数の観客が見ることができる画面に加えて、自分達が見る1つまたは複数の個人用画面を持つことができる。各観客は、本開示の実施形態を使用して、イベントのどのビューが自分達の個人的なスクリーンに表示されるかを能動的に制御することができる。つまり、観客は、前述のAIモデルを使用して、ライブゲームプレイのレンダリングのためにカメラの位置を制御する。例えば、カメラパースペクティブをスペースに固定したり、個々のプレイヤやチームをフォローしたり、人工知能によってアクションの様々な興味深い側面をキャプチャするように構成したりできる。
図8は、本開示の様々な実施形態の態様を実行するために使用することができる例示的なデバイス800の構成要素を示す。例えば、図8は、本開示の実施形態において、人工知能(AI)によってゲームアプリケーションのシーンの1つまたは複数のレンダリングを生成するのに適しており、AIによってシーンのナレーション及び/またはゲームアプリケーションのシーンのレンダリングを生成するのにさらに適した例示的なハードウェアシステムを示す。このブロック図は、各々が本発明の実施形態を実施するために適した、パーソナルコンピュータ、サーバコンピュータ、ゲーム機、モバイル機器、または他のデジタルデバイスを組み込むことができる、またはそれらである場合がある、デバイス800を示す。デバイス800は、ソフトウェアアプリケーション及び任意選択的にオペレーティングシステムを動作させる中央処理装置(CPU)802を含む。CPU802は、1つまたは複数の同種または異種の処理コアで構成され得る。
様々な実施形態によれば、CPU802は、1つまたは複数の処理コアを有する1つまたは複数の汎用マイクロプロセッサである。さらなる実施形態は、ゲームの実行中のグラフィック処理のために構成されたアプリケーションの、媒体及び双方向エンターテインメントアプリケーションなどのきわめて並列かつ計算集約的なアプリケーションに特に適合されたマイクロプロセッサアーキテクチャを有する1つまたは複数のCPUを使用し、実装することができる。
メモリ804は、CPU802とGPU816とが使用するアプリケーション及びデータを格納する。ストレージ806は、アプリケーション及びデータ用の不揮発性ストレージ及び他のコンピュータ可読媒体を提供し、かつ、固定ディスクドライブ、取り外し可能ディスクドライブ、フラッシュメモリデバイス、及びCD-ROM、DVD-ROM、Blu-ray(登録商標)、HD-DVD、または他の光学記憶デバイス、ならびに信号伝送及び記憶媒体を含み得る。
ユーザ入力デバイス808は、1人または複数のユーザからのユーザ入力をデバイス800に伝達するものであり、その例としては、キーボード、マウス、ジョイスティック、タッチパッド、タッチスクリーン、スチルまたはビデオレコーダ/カメラ、及び/またはマイクロフォンがあり得る。ネットワークインタフェース814は、デバイス800が電子通信ネットワークを介して他のコンピュータシステムと通信することを可能にし、かつ、ローカルエリアネットワーク、及びインターネットなどの広域ネットワークを介する有線または無線通信を含み得る。
オーディオプロセッサ812は、CPU802、メモリ804、及び/またはストレージ806によって提供される命令及び/またはデータから、アナログまたはデジタルのオーディオ出力を生成するように適合されている。CPU802、GPU816を含むグラフィックスサブシステム、メモリ804、データストレージ806、ユーザ入力デバイス808、ネットワークインタフェース810、及びオーディオプロセッサ812を含むデバイス800の構成要素は、1つまたは複数のデータバス822を介して接続されている。
カメラパースペクティブエンジン230は、本開示の一実施形態によれば、CPU802内に構成されてもよく、またはスタンドアロンハードウェアとしてCPU802から分離されてもよく、さらに、関心ゾーンAIモデルによって以前に観客にとって興味深いものとして識別された関心ゾーンのシーンのカメラパースペクティブを識別するように構成されており、カメラパースペクティブもまた、AIモデルによって観客にとって興味深いものとして識別される。
ブロードキャスタ/ナレータエンジン220は、本開示の一実施形態によれば、CPU802内に構成されてもよく、またはスタンドアロンハードウェアとしてCPU802から分離されてもよく、さらに、以前に関心ゾーンAIモデルによって観客にとって興味深いものとして識別された関心ゾーンのシーンのためのAIモデルを使用してナレーションを生成するように構成されており、生成されたナレーションは、AIカメラパースペクティブモデルによって識別されるカメラパースペクティブに合わせて調整することができる。
AIサーバ260は、AIカメラパースペクティブモデルをトレーニング及び/または実装するために、ならびにAIブロードキャスト/ナレーションモデルをトレーニング及び/または実装するために構成され得る。ハイライトエンジン240は、本開示の実施形態によれば、CPU802内に構成されてもよく、またはスタンドアロンハードウェアとしてCPU802から分離されてもよく、さらに、ゲームアプリケーションをプレイする1人または複数のプレイヤを含むゲームセッションのハイライトリールを生成するように構成されており、ハイライトリールは、複数のゲームアプリケーションの複数のゲームセッションにおける観客関心ゾーンを識別できるAIモデルを使用して生成されて、それらの識別された観客関心ゾーンの関心があるカメラパースペクティブを識別し、それらの識別された観客関心ゾーンのシーンに対するナレーションを提供する。
グラフィックスサブシステム814がさらに、データバス822及びデバイス800の構成要素と接続されている。グラフィックスサブシステム814は、グラフィック処理装置(GPU)816及びグラフィックメモリ818を含む。グラフィックメモリ818は、出力画像の各画素の画素データを格納するために使用される表示メモリ(例えばフレームバッファ)を含む。グラフィックメモリ818は、GPU816と同じデバイスに統合する、GPU816に別個のデバイスとして接続する、及び/またはメモリ804内に実装することができる。画素データは、CPU802から直接グラフィックメモリ818へ提供することができる。
代替として、CPU802は、所望の出力画像を定義するデータ及び/または命令をGPU816に提供し、GPU816は、そこから、1つまたは複数の出力画像の画素データを生成する。所望の出力画像を定義するデータ及び/または命令は、メモリ804及び/またはグラフィックメモリ818に格納することができる。実施形態において、GPU816は、シーンの形状、照明、陰影、質感、動き、及び/またはカメラのパラメータを定義する命令及びデータから、出力画像の画素データを生成する3Dレンダリング機能を含む。GPU816はさらに、シェーダプログラムを実行可能な1つまたは複数のプログラム可能実行ユニットを含み得る。
グラフィックスサブシステム814は、グラフィックメモリ818からの画像の画素データを周期的に出力して、ディスプレイデバイス810に表示させる、または投影システム840によって投影させる。ディスプレイデバイス810は、デバイス800からの信号に応じて視覚情報を表示可能である任意のデバイスであり得るもので、これにはCRT、LCD、プラズマ、及びOLEDディスプレイが含まれる。デバイス800は、ディスプレイデバイス810に、例えばアナログ信号またはデジタル信号を提供することができる。
グラフィックスサブシステム814を最適化するための他の実施形態は、GPUインスタンスが複数のアプリケーション間で共有されるマルチテナンシーGPU操作、及び単一のゲームをサポートする分散GPUを含むことができる。グラフィックスサブシステム814は、1つまたは複数の処理デバイスとして構成することができる。
例えば、グラフィックスサブシステム814は、一実施形態では、マルチテナンシーGPU機能を実行するように構成され得るものであり、1つのグラフィックスサブシステムが、複数のゲームのためのグラフィックス及び/またはレンダリングパイプラインを実装し得る。すなわち、グラフィックスサブシステム814は、実行されている複数のゲーム間で共有される。
他の実施形態では、グラフィックスサブシステム814は、対応するCPU上で実行されている単一のアプリケーションのためのグラフィック処理を実行するために組み合わされる複数のGPUデバイスを含む。例えば、複数のGPUが、フレームレンダリングの代替形式を実行でき、この場合、連続したフレーム期間で、GPU1は第1のフレームをレンダリングし、GPU2は第2のフレームをレンダリングするなどして、最後のGPUに到達すると、最初のGPUが次のビデオフレームをレンダリングする(例えば、GPUが2つしかない場合、GPU1は第3のフレームをレンダリングする)。
つまり、フレームをレンダリングするときにGPUが循環する。レンダリング操作は重複することができ、GPU1が第1のフレームのレンダリングを終了する前にGPU2が第2のフレームのレンダリングを開始できる。別の実施態様では、複数のGPUデバイスに、レンダリング及び/またはグラフィックスパイプラインで異なるシェーダー操作を割り当てることができる。マスターGPUがメインのレンダリングと合成を実行している。例えば、3つのGPUを含むグループでは、マスターGPU1がメインレンダリング(例えば、第1のシェーダー操作)及び、スレーブGPU2とスレーブGPU3からの出力の合成を実行でき、スレーブGPU2は第2のシェーダー(例えば、川などの流体効果)操作を実行でき、スレーブGPU3は第3のシェーダー(例えば、粒子の煙)操作を実行でき、マスターGPU1は、GPU1、GPU2、及びGPU3のそれぞれからの結果を合成する。
このようにして、様々なGPUを割り当てて、様々なシェーダー操作(旗振り、風、煙の発生、炎など)を実行してビデオフレームをレンダリングできる。さらに別の実施形態では、3つのGPUのそれぞれを、ビデオフレームに対応するシーンの異なるオブジェクト及び/または部分に割り当てることができる。上記の実施形態及び実施態様では、これらの操作は、同じフレーム周期で(同時に並行して)、または異なるフレーム周期で(順次並列に)実行することができる。
特定の実施形態は、人工知能(AI)によるゲームアプリケーションのシーンの1つまたは複数のレンダリングの生成、及び/または、AIによるゲームアプリケーションのシーンのナレーションの生成及び/またはシーンのレンダリングを実証するために提供されてきたが、本開示を読んだ当業者は、本開示の趣旨及び範囲内に入る追加の実施形態を理解するであろう。
現在の実施形態のゲームへのアクセス提供など、広範囲な地理的エリアにわたり配信されるアクセスサービスは、多くの場合、クラウドコンピューティングを使用することに留意されたい。クラウドコンピューティングとは、動的に拡張縮小可能で多くの場合仮想化されたリソースがインターネットを介したサービスとして提供される、コンピューティング様式である。ユーザは、ユーザをサポートする「クラウド」の技術的インフラストラクチャの熟練者である必要はない。クラウドコンピューティングは、Infrastructure as a Service(IaaS)、Platform as a Service(PaaS)、及びSoftware as a Service(SaaS)などの異なるサービスに分類することができる。クラウドコンピューティングサービスは、多くの場合、ビデオゲームなどの共通のアプリケーションを、ウェブブラウザからアクセスするオンラインで提供するが、ソフトウェア及びデータは、クラウド内のサーバに格納される。クラウドという用語は、コンピュータネットワーク図におけるインターネットの描かれ方に基づいたインターネットの隠喩として使用され、複雑なインフラストラクチャを隠し持つことの抽象的概念である。
ゲーム処理サーバ(GPS)(または単純に「ゲームサーバ」)は、ゲームクライアントにより、シングルプレイヤ及びマルチプレイヤのビデオゲームをプレイするために使用される。インターネット上でプレイされるほとんどのビデオゲームは、ゲームサーバへの接続を介して動作する。通常、ゲームはプレイヤからのデータを収集し、それを他のプレイヤに配信する専用サーバアプリケーションを使用する。これは、ピアツーピア構成よりも効率的かつ効果的であるが、サーバアプリケーションをホストするために別個のサーバが必要となる。別の実施形態では、GPSは、プレイヤとそれぞれのゲームプレイデバイスの間の通信を確立し、集中型GPSに依存せずに情報を交換する。
専用GPSは、クライアントとは無関係に稼働するサーバである。このようなサーバは、通常、データセンタに配置された専用ハードウェア上で実行し、より多くの帯域幅及び専用処理能力を提供する。専用サーバは、大部分のPCベースのマルチプレイヤゲームのためのゲームサーバをホスティングするのに好ましい方法である。大規模なマルチプレイヤオンラインゲームは、ゲームタイトルを所有するソフトウェア会社が通常ホストする専用サーバ上で作動し、専用サーバがコンテンツを制御及び更新することを可能にする。
ユーザは、少なくともCPU、ディスプレイ、及びI/Oを含むクライアントデバイスにより、リモートサービスにアクセスする。クライアントデバイスは、PC、携帯電話、ネットブック、PDAなどであってもよい。一実施形態では、ゲームサーバ上で実行されるネットワークは、クライアントによって使用されるデバイスのタイプを認識し、採用される通信方法を調整する。別の事例では、クライアントデバイスは、HTMLなどの標準的な通信方法を使用して、インターネットを介してゲームサーバ上のアプリケーションにアクセスする。
本開示の実施形態は、ハンドヘルドデバイス、マイクロプロセッサシステム、マイクロプロセッサベースまたはプログラム可能な一般消費者向け電気製品、小型コンピュータ、及びメインフレームコンピュータなどを含む様々なコンピュータシステム構成で実施され得る。本開示はまた、有線ベースネットワークまたは無線ネットワークを介してリンクされたリモート処理デバイスによりタスクが行われる分散型コンピューティング環境においても、実施することができる。
所与のビデオゲームが特定のプラットフォーム、及び特定の関連したコントローラデバイスのために開発されることができることを理解するであろう。しかし、このようなゲームが、本明細書に提示されるようなゲームクラウドシステムを介して利用可能となる場合、ユーザは、別のコントローラデバイスでビデオゲームにアクセスすることができる。例えば、あるゲームは、ゲームコンソール及びその関連コントローラ用に開発された可能性があるが、ユーザは、キーボード及びマウスを利用して、パーソナルコンピュータからクラウドベースバージョンのゲームにアクセスすることができる。このようなシナリオでは、入力パラメータ設定により、ユーザが利用可能なコントローラデバイス(この事例ではキーボード及びマウス)により生成され得る入力から、ビデオゲームの実行で受け入れ可能な入力へ、マッピングが定義され得る。
別の実施例では、ユーザは、タブレットコンピューティングデバイス、タッチスクリーンスマートフォン、または他のタッチスクリーン駆動デバイスを介して、クラウドゲームシステムにアクセスし得る。この場合、クライアントデバイス及びコントローラデバイスは、同じデバイス内に一緒に統合され、検出されたタッチスクリーン入力/ジェスチャにより入力が提供される。このようなデバイスでは、入力パラメータ設定により、ビデオゲームのゲーム入力に対応する特定のタッチスクリーン入力が定義され得る。
例えば、ユーザがタッチしてゲーム入力を生成することができるタッチスクリーン上の位置を示すために、ビデオゲームの実行中に、ボタン、方向パッド、または他の種類の入力要素が、表示またはオーバーレイされ得る。特定の方向のスワイプまたは特定のタッチ動作などのジェスチャも、ゲーム入力として検出され得る。一実施形態では、タッチスクリーン上での制御操作にユーザを慣れさせるために、例えばビデオゲームのゲームプレイを始める前に、タッチスクリーンを介してゲームプレイに入力する方法を示すチュートリアルが、ユーザに提供され得る。
いくつかの実施形態では、クライアントデバイスは、コントローラデバイスの接続ポイントとして機能する。すなわち、コントローラデバイスは、無線接続または有線接続を介してクライアントデバイスと通信し、コントローラデバイスからクライアントデバイスへ入力を送信する。次に、クライアントデバイスは、これらの入力を処理して、その後入力データを、ネットワーク(例えばルータなどのローカルネットワークデバイスを介してアクセスされるネットワーク)を介して、クラウドゲームサーバへ送信し得る。しかし、別の実施形態では、コントローラ自体が、このような入力をまずクライアントデバイスを通して通信する必要なく、ネットワークを介して入力を直接クラウドゲームサーバに通信する能力を有するネットワークデバイスであり得る。
例えば、コントローラは、ローカルネットワークデバイス(前述のルータなど)に接続して、クラウドゲームサーバとデータを送受信し得る。したがって、クライアントデバイスは依然として、クラウドベースビデオゲームからビデオ出力を受信して、それをローカルディスプレイ上にレンダリングする必要はあるが、コントローラがクライアントデバイスを迂回して、ネットワークを介して直接クラウドゲームサーバに入力を送信することを可能にすることにより、入力レイテンシを短縮することができる。
一実施形態では、ネットワーク化されたコントローラ及びクライアントデバイスは、特定の種類の入力を直接コントローラからクラウドゲームサーバへ、及び他の種類の入力を、クライアントデバイスを介して送信するように構成され得る。例えば、コントローラ自体は別として、任意の追加のハードウェアまたは処理に依存しない検出による入力は、クライアントデバイスを迂回して、ネットワークを介して直接コントローラからクラウドゲームサーバへ送信することができる。このような入力には、ボタン入力、ジョイスティック入力、埋込型動作検出入力(例えば加速度計、磁力計、ジャイロスコープ)などが含まれ得る。
しかし、追加のハードウェアを利用する、またはクライアントデバイスによる処理を要する入力は、クライアントデバイスによりクラウドゲームサーバへ送信され得る。これらは、ゲーム環境からキャプチャされたビデオまたはオーディオを含み得るもので、クラウドゲームサーバへ送信する前にクライアントデバイスにより処理され得る。さらに、コントローラの動作検出ハードウェアからの入力は、キャプチャされたビデオと併せてクライアントデバイスにより処理されて、コントローラの位置及び動作が検出され得るものであり、これは次いでクライアントデバイスによりクラウドゲームサーバへ通信される。様々な実施形態によるコントローラデバイスはまた、クライアントデバイスから、または直接クラウドゲームサーバから、データ(例えばフィードバックデータ)を受信し得ることを理解されたい。
本明細書で定義される様々な実施形態は、本明細書で開示される様々な特徴を使用する特定の実施態様に組み合わされ得る、または組み立てられ得ることを、理解されたい。したがって、提供される実施例は、いくつかの可能な実施例にすぎず、様々な要素を組み合わせることでより多くの実装を定義することが可能な様々な実装に限定されない。いくつかの例では、いくつかの実装は、開示された、または同等の実装の趣旨から逸脱することなく、より少ない要素を含んでもよい。
本開示の実施形態は、ハンドヘルドデバイス、マイクロプロセッサシステム、マイクロプロセッサベースまたはプログラマブル家庭用電化製品、ミニコンピュータ、メインフレームコンピュータなどを含む様々なコンピュータシステム構成で実施し得る。本開示の実施形態はまた、有線ベースネットワークまたは無線ネットワークを介してリンクされる遠隔処理デバイスによりタスクが行われる分散コンピューティング環境においても、実施することができる。
上記の実施形態を念頭に置いて、本開示の実施形態がコンピュータシステムに記憶されたデータを含む様々なコンピュータ実装の動作を使用し得ることを理解されたい。これらの動作は、物理量の物理的操作を要する動作である。本開示の実施形態の一部を形成する、本明細書で説明される動作のうちのいずれも、有用な機械動作である。本発明の実施形態はまた、これらの動作を実行するためのデバイスまたは装置に関する。装置は、必要な目的のために特別に構築されてもよく、または装置は、コンピュータに格納されたコンピュータプログラムにより選択的に有効化または構成された汎用コンピュータであってもよい。具体的には、本明細書の教示に従って書かれたコンピュータプログラムとともに様々な汎用マシンを使用することができる、あるいは、必要な動作を実行するためにさらに特化した装置を構築するほうがより好都合である場合もある。
本開示はまた、コンピュータ可読媒体上のコンピュータ可読コードとしても具現化することができる。コンピュータ可読媒体は、後でコンピュータシステムにより読み取ることができるデータを記憶できる任意のデータストレージデバイスである。コンピュータ可読媒体の例には、ハードドライブ、ネットクワーク接続ストレージ(NAS)、読み出し専用メモリ、ランダムアクセスメモリ、CD-ROM、CD-R、CD-RW、磁気テープ、ならびに他の光学及び非光学データストレージデバイスが含まれる。コンピュータ可読媒体には、コンピュータ可読コードが分散方式で記憶され実行されるように、ネットワーク接続されたコンピュータシステムにわたり分散されたコンピュータ可読有形媒体が含まれ得る。
方法動作は特定の順序で説明されたが、オーバーレイ動作の処理が所望の方法で実行される限り、動作間に他の維持管理動作が実行されてもよく、または動作がわずかに異なる時間に起こるように調整されてもよく、またはシステム内に動作を分散することで、処理に関連する様々な間隔で処理動作が起こることを可能にしてもよいことを、理解すべきである。
前述の開示は、理解を明確にするためにある程度詳細に説明されたが、添付の特許請求の範囲内で特定の変更及び修正を実施できることは明らかであろう。したがって、本実施形態は、限定ではなく例示としてみなされるべきであり、本開示の実施形態は、本明細書に提供される詳細に限定されるものではなく、添付の特許請求の範囲内及び均等物内で変更されてもよい。

Claims (20)

  1. ブロードキャストを生成するための方法であって、
    1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している前記1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信し、
    前記ゲームセッションにおいて観客関心ゾーンを識別し、前記観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができる前記ビデオゲームの前記仮想ゲーム世界のシーンを有するものであり、
    前記ゲーム状態データと前記ユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1の人工知能(AI)モデルを使用して、前記ゲームセッションの統計及びファクトを生成し、
    前記第1のAIモデルを使用して生成される前記統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、前記観客関心ゾーンの前記シーンのナレーションを生成し、前記選択された統計及びファクトには、前記第2のAIモデルによって決定される最高の潜在的な観客の関心があり、前記第2のAIモデルは、前記選択された統計及びファクトを使用して前記ナレーションを生成するように構成されている、方法。
  2. 前記観客関心ゾーンが、1人または複数の観客によって見られる可能性が高い1つまたは複数の観客関心ゾーンを分離するようにトレーニングされた第3のAIモデルに基づいて識別され、前記1つまたは複数の観客関心ゾーンのそれぞれは、前記仮想ゲーム世界の対応するシーンを有するか、または
    前記観客関心ゾーンが観客によって選択される、請求項1に記載の方法。
  3. さらに、前記ビデオゲームのビデオゲームタイプと前記観客関心ゾーンの関心ゾーンタイプとに基づくシナリオ用に構築されたナレーションテンプレートを使用して、前記ナレーションを生成する、請求項1に記載の方法。
  4. さらに、対応する観客関心ゾーンの対応するシーンの1つまたは複数の対応するカメラパースペクティブを生成するようにトレーニングされた第4のAIモデルに基づいて、前記観客関心ゾーンの第1のカメラパースペクティブを識別し、
    前記第1のカメラパースペクティブに基づいて前記ナレーションを生成する、請求項1に記載の方法。
  5. さらに、ネットワークを介して、前記第1のカメラパースペクティブ及び前記ナレーションを1人または複数の観客にストリーミングする、請求項4に記載の方法。
  6. 前記シーンのナレーションの前記生成では、
    1つまたは複数の第1の慣習及び第1の地理的地域の第1の通信フォーマットに合わせて調整された、前記シーンの第1のナレーションを生成し、
    1つまたは複数の第2の慣習及び第2の地理的地域の第2の通信フォーマットに合わせて調整された、前記シーンの第2のナレーションを生成する、請求項1に記載の方法。
  7. さらに、前記ゲームセッションに参加しているプレイヤの以前のゲームプレイの前記観客関心ゾーンを識別し、
    前記以前のゲームプレイのハイライトとして前記第1のカメラパースペクティブ及び前記ナレーションをストリーミングし、
    前記第1のカメラパースペクティブは、以前のゲームプレイ中に以前に生成されたものであるか、または
    前記第1のカメラパースペクティブは、前記プレイヤの前記以前のゲームプレイの前記シーンに対して新たに生成されるものである、請求項4に記載の方法。
  8. さらに、複数のビデオゲームの複数のゲームセッションに参加している複数のプレイヤのために生成された1つまたは複数の統計及びファクトを選択する人間の入力を受信し、
    人間の入力によって選択された1つまたは複数の統計及びファクトを使用して前記第2のAIモデルをトレーニングする、請求項1に記載の方法。
  9. さらに、複数のビデオゲームの複数のゲームセッションに参加している複数のプレイヤのゲーム状態データ及びユーザデータを受信し、
    前記複数のゲームセッションのビューに対応する情報を受信し、前記ビューは対応するナレーションを有するものであり、
    前記情報を使用して前記第2のAIモデルをトレーニングし、
    前記情報は、
    観客のジャンプインの数、または、
    前記複数のゲームセッションの視聴中に提供される観客の解説、または、
    前記複数のゲームセッションの視聴中に提供される観客のバイオフィードバック、または、
    前記複数のゲームセッションの視聴中に提供される観客のアクション、または、
    前記複数のゲームセッションのそれぞれに対する観客のリプレイの数、または、
    前記複数のゲームセッションのそれぞれに対する観客のライブビューの数、または、
    観客の反応、または、
    前記複数のゲームセッションのそれぞれに対するソーシャルメディアの傾向、
    を含む、請求項1に記載の方法。
  10. ブロードキャストを生成するためのコンピュータプログラムを格納する非一時的なコンピュータ可読媒体であって、
    前記1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信するためのプログラム命令と、
    前記ゲームセッションにおいて観客関心ゾーンを識別するためのプログラム命令であって、前記観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができる前記ビデオゲームの前記仮想ゲーム世界のシーンを有する、前記プログラム命令と、
    前記ゲーム状態データと前記ユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1の人工知能(AI)モデルを使用して、前記ゲームセッションの統計及びファクトを生成するためのプログラム命令と、
    前記第1のAIモデルを使用して生成された統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、前記観客関心ゾーンの前記シーンのナレーションを生成するためのプログラム命令であって、前記選択された統計及びファクトには、前記第2のAIモデルによって決定される最高の潜在的な観客の関心があり、前記第2のAIモデルは、前記選択された統計及びファクトを使用して前記ナレーションを生成するように構成されているプログラム命令と、
    を含む、非一時的なコンピュータ可読媒体。
  11. 前記観客関心ゾーンが、1人または複数の観客によって見られる可能性が高い1つまたは複数の観客関心ゾーンを分離するようにトレーニングされた第3のAIモデルに基づいて識別され、前記1つまたは複数の観客関心ゾーンのそれぞれは、前記仮想ゲーム世界の対応するシーンを有するか、または
    前記観客関心ゾーンが観客によって選択される、請求項10に記載の非一時的なコンピュータ可読媒体。
  12. ネットワークを介して、前記第1のカメラパースペクティブ及び前記ナレーションを1人または複数の観客にストリーミングするためのプログラム命令 をさらに含む、請求項10に記載の非一時的なコンピュータ可読媒体。
  13. 前記シーンのナレーションを生成するための前記プログラム命令が、
    1つまたは複数の第1の慣習及び第1の地理的地域の第1の通信フォーマットに合わせて調整された、前記シーンの第1のナレーションを生成するためのプログラム命令と、
    1つまたは複数の第2の慣習及び第2の地理的地域の第2の通信フォーマットに合わせて調整された、前記シーンの第2のナレーションを生成するためのプログラム命令と、を含む、請求項10に記載の非一時的なコンピュータ可読媒体。
  14. 前記ゲームセッションに参加しているプレイヤの以前のゲームプレイの前記観客関心ゾーンを識別するためのプログラム命令と、
    前記以前のゲームプレイのハイライトとして前記第1のカメラパースペクティブ及び前記ナレーションをストリーミングするためのプログラム命令と、
    をさらに含み、
    前記第1のカメラパースペクティブは、以前のゲームプレイ中に以前に生成されたものであるか、または
    前記第1のカメラパースペクティブは、前記プレイヤの前記以前のゲームプレイの前記シーンに対して新たに生成されるものである、請求項12に記載の非一時的なコンピュータ可読媒体。
  15. 複数のビデオゲームの複数のゲームセッションに参加している複数のプレイヤのゲーム状態データ及びユーザデータを受信するためのプログラム命令と、
    前記複数のゲームセッションのビューに対応する情報を受信するためのプログラム命令であって、前記ビューは対応するナレーションを有する、前記プログラム命令と、
    前記情報を使用して前記第2のAIモデルをトレーニングするためのプログラム命令と、
    をさらに含み、
    前記情報は、
    観客のジャンプインの数、または、
    前記複数のゲームセッションの視聴中に提供される観客の解説、または、
    前記複数のゲームセッションの視聴中に提供される観客のバイオフィードバック、または、
    前記複数のゲームセッションの視聴中に提供される観客のアクション、または、
    前記複数のゲームセッションのそれぞれに対する観客のリプレイの数、または、
    前記複数のゲームセッションのそれぞれに対する観客のライブビューの数、または、
    観客の反応、または、
    前記複数のゲームセッションのそれぞれに対するソーシャルメディアの傾向、
    を含む、請求項10に記載の非一時的なコンピュータ可読媒体。
  16. プロセッサと、
    前記プロセッサに接続され、中に命令を格納しているメモリと、
    を含み、前記命令は、前記コンピュータシステムにより実行されると、ブロードキャストを生成する方法を前記コンピュータシステムに実行させ、前記方法は、
    1人または複数のプレイヤによってプレイされているビデオゲームのゲームセッションに参加している前記1人または複数のプレイヤのゲーム状態データ及びユーザデータを受信し、
    前記ゲームセッションにおいて観客関心ゾーンを識別し、前記観客関心ゾーンは、仮想ゲーム世界の1つまたは複数のカメラパースペクティブから見ることができる前記ビデオゲームの前記仮想ゲーム世界のシーンを有する、前記識別し、
    前記ゲーム状態データと前記ユーザデータに基づいて1人または複数の観客が興味を持つ可能性が高いゲーム状態データとユーザデータを分離するようにトレーニングされた第1の人工知能(AI)モデルを使用して、前記ゲームセッションの統計及びファクトを生成し、
    前記第1のAIモデルを使用して生成される前記統計及びファクトから統計及びファクトを選択するように構成された第2のAIモデルを使用して、前記観客関心ゾーンの前記シーンのナレーションを生成し、前記選択された統計及びファクトには、前記第2のAIモデルによって決定される最高の潜在的な観客の関心があり、前記第2のAIモデルは、前記選択された統計及びファクトを使用して前記ナレーションを生成するように構成されている、コンピュータシステム。
  17. 前記方法において、前記観客関心ゾーンが、1人または複数の観客によって見られる可能性が高い1つまたは複数の観客関心ゾーンを分離するようにトレーニングされた第3のAIモデルに基づいて識別され、前記1つまたは複数の観客関心ゾーンのそれぞれは、前記仮想ゲーム世界の対応するシーンを有するか、または
    前記方法において、前記観客関心ゾーンが観客によって選択される、請求項16に記載のコンピュータシステム。
  18. 前記方法では、さらに、
    ネットワークを介して、前記第1のカメラパースペクティブ及び前記ナレーションを1人または複数の観客にストリーミングする、請求項16に記載のコンピュータシステム。
  19. 前記方法において前記シーンのナレーション生成では、
    1つまたは複数の第1の慣習及び第1の地理的地域の第1の通信フォーマットに合わせて調整された、前記シーンの第1のナレーションを生成し、
    1つまたは複数の第2の慣習及び第2の地理的地域の第2の通信フォーマットに合わせて調整された、前記シーンの第2のナレーションを生成する、請求項16に記載のコンピュータシステム。
  20. 前記方法では、さらに、
    前記ゲームセッションに参加しているプレイヤの以前のゲームプレイの前記観客関心ゾーンを識別し、
    前記以前のゲームプレイのハイライトとして前記第1のカメラパースペクティブ及び前記ナレーションをストリーミングし、
    前記第1のカメラパースペクティブは、以前のゲームプレイ中に以前に生成されたものであるか、または
    前記第1のカメラパースペクティブは、前記プレイヤの前記以前のゲームプレイの前記シーンに対して新たに生成されるものである、請求項18に記載のコンピュータシステム。
JP2022518936A 2019-09-26 2020-09-09 人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ Active JP7320672B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/584,842 US11103782B2 (en) 2019-09-26 2019-09-26 Artificial intelligence (AI) controlled camera perspective generator and AI broadcaster
US16/584,842 2019-09-26
PCT/US2020/049977 WO2021061405A1 (en) 2019-09-26 2020-09-09 Artificial intelligence (ai) controlled camera perspective generator and ai broadcaster

Publications (2)

Publication Number Publication Date
JP2022548331A true JP2022548331A (ja) 2022-11-17
JP7320672B2 JP7320672B2 (ja) 2023-08-03

Family

ID=72603547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022518936A Active JP7320672B2 (ja) 2019-09-26 2020-09-09 人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ

Country Status (5)

Country Link
US (3) US11103782B2 (ja)
EP (1) EP4017606A1 (ja)
JP (1) JP7320672B2 (ja)
CN (2) CN116474378A (ja)
WO (1) WO2021061405A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11305191B2 (en) 2018-12-20 2022-04-19 Activision Publishing, Inc. Systems and methods for controlling camera perspectives, movements, and displays of video game gameplay
JP7343285B2 (ja) * 2019-03-20 2023-09-12 株式会社コーエーテクモゲームス コンピュータシステム、配信用端末及び配信サーバー
US11420122B2 (en) * 2019-12-23 2022-08-23 Activision Publishing, Inc. Systems and methods for controlling camera perspectives, movements, and displays of video game gameplay
US11148061B2 (en) * 2020-01-15 2021-10-19 Sony Interactive Entertainment Inc. Spectators vote to bench players in a video game
US11439904B2 (en) 2020-11-11 2022-09-13 Activision Publishing, Inc. Systems and methods for imparting dynamic and realistic movement to player-controlled avatars in video games
JP6928709B1 (ja) * 2020-12-28 2021-09-01 プラチナゲームズ株式会社 情報処理プログラム、情報処理装置、および情報処理方法
US20220212100A1 (en) * 2021-01-04 2022-07-07 Microsoft Technology Licensing, Llc Systems and methods for streaming interactive applications
US11794119B2 (en) * 2021-03-01 2023-10-24 Super League Gaming, Inc. Intelligent prioritization and manipulation of stream views
JP2024011105A (ja) * 2022-07-14 2024-01-25 株式会社電通 実況音声リアルタイム生成システム
US20240238679A1 (en) * 2023-01-17 2024-07-18 Sony Interactive Entertainment Inc. Method and system for generating an image representing the results of a gaming session

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007143030A (ja) * 2005-11-22 2007-06-07 Advanced Telecommunication Research Institute International ビデオコンテンツ作成装置
US20090061974A1 (en) * 2007-08-29 2009-03-05 Lutnick Howard W Game with chance element and strategy component that can be copied
US20090325706A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Live hosting toolset
US20170157512A1 (en) * 2015-12-06 2017-06-08 Sliver VR Technologies, Inc. Methods and systems for computer video game streaming, highlight, and replay
JP2019512317A (ja) * 2016-03-15 2019-05-16 スキルズ インコーポレイテッド ピアツーピアビデオゲームトーナメントにおける試合横断分析
JP2021164146A (ja) * 2020-03-30 2021-10-11 株式会社ドワンゴ 動画配信装置、動画配信方法、および、動画配信プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8025572B2 (en) * 2005-11-21 2011-09-27 Microsoft Corporation Dynamic spectator mode
US20120276992A1 (en) * 2011-04-27 2012-11-01 Microsoft Corporation Most valuable player gamer status and applications
US20140038708A1 (en) 2012-07-31 2014-02-06 Cbs Interactive Inc. Virtual viewpoint management system
JP2018524134A (ja) * 2015-06-14 2018-08-30 株式会社ソニー・インタラクティブエンタテインメント Vr観戦のための拡大された視野再レンダリング
US20170065888A1 (en) 2015-09-04 2017-03-09 Sri International Identifying And Extracting Video Game Highlights
US20170106283A1 (en) 2015-10-16 2017-04-20 Microsoft Technology Licensing, Llc Automated generation of game event recordings
US10695680B2 (en) 2016-12-09 2020-06-30 Unity IPR ApS Systems and methods for creating, broadcasting, and viewing 3D content
CN107423274B (zh) 2017-06-07 2020-11-20 北京百度网讯科技有限公司 基于人工智能的比赛解说内容生成方法、装置及存储介质
US10765954B2 (en) 2017-06-15 2020-09-08 Microsoft Technology Licensing, Llc Virtual event broadcasting
US10792577B2 (en) 2018-02-28 2020-10-06 Sony Interactive Entertainment LLC Discovery and detection of events in interactive content

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007143030A (ja) * 2005-11-22 2007-06-07 Advanced Telecommunication Research Institute International ビデオコンテンツ作成装置
US20090061974A1 (en) * 2007-08-29 2009-03-05 Lutnick Howard W Game with chance element and strategy component that can be copied
US20090325706A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Live hosting toolset
US20170157512A1 (en) * 2015-12-06 2017-06-08 Sliver VR Technologies, Inc. Methods and systems for computer video game streaming, highlight, and replay
JP2019512317A (ja) * 2016-03-15 2019-05-16 スキルズ インコーポレイテッド ピアツーピアビデオゲームトーナメントにおける試合横断分析
JP2021164146A (ja) * 2020-03-30 2021-10-11 株式会社ドワンゴ 動画配信装置、動画配信方法、および、動画配信プログラム

Also Published As

Publication number Publication date
CN114746159B (zh) 2023-04-14
US11103782B2 (en) 2021-08-31
JP7320672B2 (ja) 2023-08-03
CN116474378A (zh) 2023-07-25
CN114746159A (zh) 2022-07-12
US20240307775A1 (en) 2024-09-19
US11992761B2 (en) 2024-05-28
US20210387089A1 (en) 2021-12-16
US20210093969A1 (en) 2021-04-01
EP4017606A1 (en) 2022-06-29
WO2021061405A1 (en) 2021-04-01

Similar Documents

Publication Publication Date Title
JP7320672B2 (ja) 人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ
JP7224715B2 (ja) 人工知能(ai)制御のカメラパースペクティブジェネレータ及びaiブロードキャスタ
JP7554675B2 (ja) ゲームクラウドシステム上で実行される、任意のユーザによるゲームプレイ実行を後で開始するために使用される、ゲームプレイのスナップショットを保存するための方法及びシステム
TWI716201B (zh) 用於為一線上遊戲提供資源之分佈式遊戲引擎及方法
CN109792564B (zh) 用于通过在游戏云系统上执行的视频记录访问先前所存储游戏情节的方法和系统
US20230356081A1 (en) Drama engine for dramatizing video gaming in a highlight reel including user reaction
CN103886009B (zh) 基于所记录的游戏玩法自动产生为云游戏建议的小游戏
US11666830B2 (en) Local game execution for spectating and spectator game play
JP7339318B2 (ja) ゲーム内位置ベースのゲームプレイコンパニオンアプリケーション
CN115175751A (zh) 基于预测的游戏活动和观众特性驱动虚拟影响者
US20220395756A1 (en) Building a dynamic social community based on similar interaction regions of game plays of a gaming application
US11729479B2 (en) Methods and systems for dynamic summary queue generation and provision
WO2024026205A1 (en) Impaired player accessability with overlay logic providing haptic responses for in-game effects
CN117769823A (zh) 使用在多个平台上跟踪印象的nft进行游戏内资产跟踪
US20230381649A1 (en) Method and system for automatically controlling user interruption during game play of a video game

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220509

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230724

R150 Certificate of patent or registration of utility model

Ref document number: 7320672

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150