JP2024011105A - 実況音声リアルタイム生成システム - Google Patents

実況音声リアルタイム生成システム Download PDF

Info

Publication number
JP2024011105A
JP2024011105A JP2022112830A JP2022112830A JP2024011105A JP 2024011105 A JP2024011105 A JP 2024011105A JP 2022112830 A JP2022112830 A JP 2022112830A JP 2022112830 A JP2022112830 A JP 2022112830A JP 2024011105 A JP2024011105 A JP 2024011105A
Authority
JP
Japan
Prior art keywords
sports game
live
video
machine learning
predetermined scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022112830A
Other languages
English (en)
Inventor
和広 志村
Kazuhiro Shimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dentsu Group Inc
Original Assignee
Dentsu Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dentsu Inc filed Critical Dentsu Inc
Priority to JP2022112830A priority Critical patent/JP2024011105A/ja
Priority to PCT/JP2023/025888 priority patent/WO2024014509A1/ja
Publication of JP2024011105A publication Critical patent/JP2024011105A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】 対象スポーツゲームの実況音声をリアルタイムで自動的に生成することのできる実況音声リアルタイム生成システムを提供する。【解決手段】 実況音声リアルタイム生成システム1は、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力されると、第1機械学習部14で分析した関係に基づいて、入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する。そして、対象スポーツゲームに関するファクト情報を取得すると、第2機械学習部15で分析した関係に基づいて、取得したファクト情報および出力された実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する。【選択図】 図1

Description

本発明は、スポーツゲームの所定シーンの実況音声をリアルタイムで生成する実況音声リアルタイム生成システムに関する。
従来、携帯端末を利用するスポーツ実況システムが提案されている(例えば、特許文献1参照)。従来のシステムでは、携帯機器にアニメーション化した実況画像が表示され、リアルタイムでスポーツ実況が行われる。
特開2006-260554号公報
従来のシステムでは、アニメーション化した野球の実況画面(例えば、ピッチャーが投球し、バッターがバットを振る動作がアニメーションで表示される画面)が表示されるが、視覚障害者(その画面を見ることに障害のある者)がスポーツ観戦を楽しむことは困難である。従来、視覚障害者がスポーツ観戦を楽しむためのシステム(例えば、そのシーンの実況音声をリアルタイムで生成するシステム)について、何らの提案もなされていない。
本発明は、上記の課題に鑑みてなされたもので、スポーツゲームの所定シーンの実況音声をリアルタイムで生成することのできる実況音声リアルタイム生成システムを提供することを目的とする。
本発明の実況音声リアルタイム生成システムは、過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習部と、前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習部と、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力部と、前記第1機械学習部で分析した関係に基づいて、前記映像入力部から入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定部と、前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得部と、前記第2機械学習部で分析した関係に基づいて、前記ファクト情報取得部で取得した前記対象スポーツゲームに関するファクト情報および前記第1推定部から出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定部と、を備えている。
この構成によれば、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
また、本発明の実況音声リアルタイム生成システムは、過去のスポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像と、前記複数の所定シーンの映像うち当該過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する第3機械学習部と、前記第3機械学習部で分析した関係に基づいて、前記対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像を入力として、前記複数の所定シーンの映像うち当該対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する第3推定部と、を備え、前記第3推定部から出力された前記対象スポーツゲームの実況中継に用いられる所定シーンの映像が前記映像入力部に入力されてもよい。
この構成によれば、対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像が入力されると、第3機械学習部で分析した関係を用いて、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像が推定される。このようにして、対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像の中から、映像入力部に入力される所定シーンの映像(対象スポーツゲームの実況音声のリアルタイム生成に用いられる所定シーンの映像)を適切に選択することができる。
本発明の実況音声リアルタイム生成方法は、過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習ステップと、前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習ステップと、実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力ステップと、前記第1機械学習ステップで分析した関係に基づいて、前記映像入力ステップから入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定ステップと、前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得ステップと、前記第2機械学習ステップで分析した関係に基づいて、前記ファクト情報取得ステップで取得した前記対象スポーツゲームに関するファクト情報および前記第1推定ステップから出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定ステップと、を含んでいる。
この方法によっても、上記のシステムと同様に、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
本発明によれば、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することができる。
本発明の実施の形態における実況音声リアルタイム生成システムの構成を示すブロック図である。 本発明の実施の形態においてスポーツゲーム会場に設置される複数のカメラの例を模式的に示す図である。 本発明の実施の形態における実況音声リアルタイム生成システムの動作を説明するためのフロー図である。
以下、本発明の実施の形態の実況音声リアルタイム生成システムについて、図面を用いて説明する。本実施の形態では、視覚障害者がスポーツ観戦を楽しむシステム等に用いられる実況音声リアルタイム生成システムの場合を例示する。
本発明の実施の形態の実況音声リアルタイム生成システムの構成を、図面を参照して説明する。図1は、本実施の形態の実況音声リアルタイム生成システムの構成を示すブロック図である。図1に示すように、実況音声リアルタイム生成システム1は、ネットワークNを介してスポーツゲーム撮影システム2と接続されている。スポーツゲーム撮影システム2は、野球などの試合中の映像を撮影する複数のカメラ21と、撮影した映像をネットワークNを介して配信する映像配信部22を備えている。なお、図2に示すように、スポーツゲームの会場Sには、スポーツゲームの様々なシーンの映像を取得できるように、複数のカメラ21(カメラA、カメラB、カメラC・・・)が様々な位置に設定されている。
図1に示すように、実況音声リアルタイム生成システム1は、スポーツゲーム撮影システム2から配信された試合中の映像(カメラ映像)を取得する映像取得部11と、実況音声をリアルタイム生成するスポーツゲーム(対象スポーツゲーム)の所定シーンの映像が入力される映像入力部12と、対象スポーツゲームに関するファクト情報を取得するファクト情報取得部13を備えている。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、ファクト情報は「選手名、ボールカウント、アウトカウント、スコア」などである。ファクト情報は、例えば、スポーツゲーム主催者の情報データベース(図示せず)などから取得することができる。
また、実況音声リアルタイム生成システム1は、過去の試合の映像データが記憶される映像記憶部3を備えている。なお、映像記憶部3には、スポーツゲーム撮影システム2から配信された試合中の映像が記憶されてもよい。
さらに、実況音声リアルタイム生成システム1は、3つの機械学習部(第1機械学習部14、第2機械学習部15、第3機械学習部16)と、3つの推定部(第1推定部17、第2推定部18、第3推定部19)を備えている。
第1機械学習部14は、過去のスポーツゲームの所定シーンの映像と、その過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する。この機械学習には、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームの所定シーンの映像を入力層に入力し、その過去のスポーツゲームの所定シーンにおける実況情報を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
第1推定部17は、第1機械学習部14で分析した関係に基づいて、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する。例えば、上記のニューラルネットワークであれば、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力層に入力し、その対象スポーツゲームの所定シーンにおける実況情報を出力層から出力することにより、推定が行われる。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、実況情報は「ピッチャー投げました。バッター空振り。」などである。
第2機械学習部15は、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報と、その過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する。この機械学習にも、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報を入力層に入力し、その過去のスポーツゲームの所定シーンにおける実況音声を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
第2推定部18は、第2機械学習部15で分析した関係に基づいて、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する。例えば、上記のニューラルネットワークであれば、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力層に入力し、その対象スポーツゲームの所定シーンにおける実況音声を出力層から出力することにより、推定が行われる。例えば、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、実況音声は「ピッチャーA(選手名)が投げました。バッターB(選手名)が空振り。ワンボール・ワンストライク。」などである。
第3機械学習部16は、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像と、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する。この機械学習にも、ニューラルネットワークによるディープラーニング等の任意の手法が用いられる。例えば、ニューラルネットワークであれば、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力層に入力し、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像を出力層から出力するように構成する。そして、入力層に入力するデータと出力層から出力されるデータとが紐付けられた分析用データを用いた教師あり学習によって、ニューラルネットワークのニューロン間の重み付け係数が最適化される。
第3推定部19は、第3機械学習部16で分析した関係に基づいて、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力として、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する。例えば、上記のニューラルネットワークであれば、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像を入力層に入力し、それら複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像を出力層から出力することにより、推定が行われる。第3推定部19から出力された対象スポーツゲームの実況中継に用いられる所定シーンの映像が映像入力部12に入力される。
以上のように構成された実況音声リアルタイム生成システム1について、図3のフロー図を参照してその動作を説明する。
本実施の形態の実況音声リアルタイム生成システム1では、まず事前の準備として、第1機械学習部14において、過去のスポーツゲームの所定シーンの映像と、その過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する(第1機械学習ステップ)。また、第2機械学習部15において、過去のスポーツゲームに関するファクト情報および過去のスポーツゲームの所定シーンにおける実況情報と、その過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する(第2機械学習ステップ)。さらに、第3機械学習部16において、過去のスポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像と、複数の所定シーンの映像うちその過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する(第3機械学習ステップ)。
そして、図3に示すように、対象スポーツゲームの実況音声をリアルタイム生成する場合には、スポーツゲーム撮影システム2から配信された試合中の複数のカメラ映像を取得し(S1)、第3機械学習部16で分析した関係に基づいて、対象スポーツゲームの会場に設置された複数のカメラ映像(複数の所定シーンの映像)を入力として、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像(中継映像)を推定して出力する(S2)。そして、推定された所定シーンの映像(中継映像)が映像入力部12に入力される。なお、実際に対象スポーツゲームの実況中継が行われてる場合には、中継映像を推定するステップS2は不要であり、実際の中継映像が映像入力部12に入力される。
つぎに、第1機械学習部14で分析した関係に基づいて、映像入力部12から入力された対象スポーツゲームの所定シーンの映像を入力として、その対象スポーツゲームの所定シーンにおける実況情報を推定して出力する(S3)。その後、ファクト情報取得部13において、対象スポーツゲームに関するファクト情報を取得し(S4)、第2機械学習部15で分析した関係に基づいて、ファクト情報取得部13で取得した対象スポーツゲームに関するファクト情報および第1推定部17から出力された対象スポーツゲームの所定シーンにおける実況情報を入力として、その対象スポーツゲームの所定シーンにおける実況音声を推定して出力する(S5)。
このような本実施の形態の実況音声リアルタイム生成システム1によれば、まず、実況音声をリアルタイム生成する対象スポーツゲーム(例えば、野球など)の所定シーンの映像が入力されると、第1機械学習部14で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況情報(例えば、「ピッチャー投げました。バッター空振り。」など)が推定される。つぎに、対象スポーツゲームに関するファクト情報(例えば、選手名「ピッチャーA、バッターB」、ボールカウント「ワンボール・ワンストライク」、アウトカウント「ノーアウト」、スコア「0対0」など)を取得すると、第2機械学習部15で分析した関係を用いて、その対象スポーツゲームの所定シーンにおける実況音声(例えば、「ピッチャーAが投げました。バッターBが空振り。ワンボール・ワンストライク。」など)が推定される。このようにして、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することが可能になる。
また、本実施の形態では、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像が入力されると、第3機械学習部16で分析した関係を用いて、複数の所定シーンの映像うち対象スポーツゲームの実況中継に用いられる所定シーンの映像が推定される。このようにして、対象スポーツゲームの会場に設置された複数のカメラ21で撮影される複数の所定シーンの映像の中から、映像入力部12に入力される所定シーンの映像(対象スポーツゲームの実況音声のリアルタイム生成に用いられる所定シーンの映像)を適切に選択することができる。
以上、本発明の実施の形態を例示により説明したが、本発明の範囲はこれらに限定されるものではなく、請求項に記載された範囲内において目的に応じて変更・変形することが可能である。
以上の説明では、実況音声をリアルタイム生成する対象スポーツゲームが「野球」である場合、例えば、ファクト情報が「選手名、ボールカウント、アウトカウント、スコア」などであり、実況情報が「ピッチャー投げました。バッター空振り。」などであり、実況音声が「ピッチャーA(選手名)が投げました。バッターB(選手名)が空振り。ワンボール・ワンストライク。」などである例について説明したが、その他のスポーツゲームについても同様に実施可能である。
例えば、実況音声をリアルタイム生成する対象スポーツゲームが「競馬」である場合には、ファクト情報は「馬名、馬番、騎手名、順位」などであり、実況情報は「各馬一斉にスタート。」などであり、実況音声は「各場一斉にスタート。先頭はC(馬名)。」などであってもよい。
また、実況音声をリアルタイム生成する対象スポーツゲームが「モータースポーツ」である場合には、ファクト情報は「チーム名、ドライバー名、順位」などであり、実況情報は「バックストレートで先頭が2番手に抜かれた。」などであり、実況音声は「バックストレートで先頭のD(ドライバー名)が2番手のE(ドライバー名)に抜かれた。」などであってもよい。
以上のように、本発明にかかる実況音声リアルタイム生成システムは、対象スポーツゲームの実況音声をリアルタイムで自動的に生成することができるという効果を有し、視覚障害者がスポーツ観戦を楽しむシステム等として有用である。
1 実況音声リアルタイム生成システム
2 スポーツゲーム撮影システム
3 映像記憶部
11 映像取得部
12 映像入力部
13 ファクト情報取得部
14 第1機械学習部
15 第2機械学習部
16 第3機械学習部
17 第1推定部
18 第2推定部
19 第3推定部
21 カメラ
22 映像配信部
N ネットワーク

Claims (3)

  1. 過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習部と、
    前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習部と、
    実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力部と、
    前記第1機械学習部で分析した関係に基づいて、前記映像入力部から入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定部と、
    前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得部と、
    前記第2機械学習部で分析した関係に基づいて、前記ファクト情報取得部で取得した前記対象スポーツゲームに関するファクト情報および前記第1推定部から出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定部と、
    を備える、実況音声リアルタイム生成システム。
  2. 過去のスポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像と、前記複数の所定シーンの映像うち当該過去のスポーツゲームの実況中継に用いられる所定シーンの映像との関係を、機械学習により分析する第3機械学習部と、
    前記第3機械学習部で分析した関係に基づいて、前記対象スポーツゲームの会場に設置された複数のカメラで撮影される複数の所定シーンの映像を入力として、前記複数の所定シーンの映像うち当該対象スポーツゲームの実況中継に用いられる所定シーンの映像を推定して出力する第3推定部と、
    を備え、
    前記第3推定部から出力された前記対象スポーツゲームの実況中継に用いられる所定シーンの映像が前記映像入力部に入力される、請求項1に記載の実況音声リアルタイム生成システム。
  3. 過去のスポーツゲームの所定シーンの映像と、当該過去のスポーツゲームの所定シーンにおける実況情報との関係を、機械学習により分析する第1機械学習ステップと、
    前記過去のスポーツゲームに関するファクト情報および前記過去のスポーツゲームの所定シーンにおける実況情報と、当該過去のスポーツゲームの所定シーンにおける実況音声との関係を、機械学習により分析する第2機械学習ステップと、
    実況音声をリアルタイム生成する対象スポーツゲームの所定シーンの映像が入力される映像入力ステップと、
    前記第1機械学習ステップで分析した関係に基づいて、前記映像入力ステップから入力された前記対象スポーツゲームの所定シーンの映像を入力として、当該対象スポーツゲームの所定シーンにおける実況情報を推定して出力する第1推定ステップと、
    前記対象スポーツゲームに関するファクト情報を取得するファクト情報取得ステップと、
    前記第2機械学習ステップで分析した関係に基づいて、前記ファクト情報取得ステップで取得した前記対象スポーツゲームに関するファクト情報および前記第1推定ステップから出力された前記対象スポーツゲームの所定シーンにおける実況情報を入力として、当該対象スポーツゲームの所定シーンにおける実況音声を推定して出力する第2推定ステップと、
    を含む、実況音声リアルタイム生成方法。
JP2022112830A 2022-07-14 2022-07-14 実況音声リアルタイム生成システム Pending JP2024011105A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022112830A JP2024011105A (ja) 2022-07-14 2022-07-14 実況音声リアルタイム生成システム
PCT/JP2023/025888 WO2024014509A1 (ja) 2022-07-14 2023-07-13 実況音声リアルタイム生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022112830A JP2024011105A (ja) 2022-07-14 2022-07-14 実況音声リアルタイム生成システム

Publications (1)

Publication Number Publication Date
JP2024011105A true JP2024011105A (ja) 2024-01-25

Family

ID=89536769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022112830A Pending JP2024011105A (ja) 2022-07-14 2022-07-14 実況音声リアルタイム生成システム

Country Status (2)

Country Link
JP (1) JP2024011105A (ja)
WO (1) WO2024014509A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2894123T3 (es) * 2017-05-24 2022-02-11 Japan Broadcasting Corp Dispositivo de generación de orientación de audio, procedimiento de generación de orientación de audio y sistema de difusión
KR20210026650A (ko) * 2019-08-30 2021-03-10 주식회사 케이티 스포츠 중계 문장을 제공하는 서버, 방법 및 컴퓨터 프로그램
US11103782B2 (en) * 2019-09-26 2021-08-31 Sony Interactive Entertainment Inc. Artificial intelligence (AI) controlled camera perspective generator and AI broadcaster
WO2021240644A1 (ja) * 2020-05-26 2021-12-02 富士通株式会社 情報出力プログラム、装置、及び方法
JP2022067478A (ja) * 2020-10-20 2022-05-06 富士通株式会社 情報処理プログラム、装置、及び方法

Also Published As

Publication number Publication date
WO2024014509A1 (ja) 2024-01-18

Similar Documents

Publication Publication Date Title
US10771760B2 (en) Information processing device, control method of information processing device, and storage medium
WO2021139728A1 (zh) 全景视频处理方法、装置、设备及存储介质
CN107105315A (zh) 直播方法、主播客户端的直播方法、主播客户端及设备
US20120120201A1 (en) Method of integrating ad hoc camera networks in interactive mesh systems
US9154710B2 (en) Automatic camera identification from a multi-camera video stream
JP2020086983A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2008167127A (ja) 映像配信方法及び映像配信装置
JP4401220B2 (ja) ハイライトシーン抽出装置およびハイライトシーン配信システム
CN114550067A (zh) 一种体育赛事自动直播与导播方法、装置、设备及存储介质
CN114025183B (zh) 直播方法、装置、设备、系统和存储介质
WO2024014509A1 (ja) 実況音声リアルタイム生成システム
JP2024001268A (ja) 制御装置
JP7301521B2 (ja) 画像処理装置
JP2010087617A (ja) 撮影装置及びカメラシステム
JP2005286377A (ja) シーン抽出システムおよびシーン抽出方法
CN114288645A (zh) 一种画面生成方法、系统、装置及计算机存储介质
JP7282519B2 (ja) 画像処理装置または画像処理サーバー
WO2021124750A1 (ja) 情報処理装置、情報処理方法、プログラム
JP7235098B2 (ja) 情報配信装置、情報配信方法、情報配信プログラム
CN107027043A (zh) 虚拟现实场景直播方法
CN113273171A (zh) 图像处理装置、图像处理服务器、图像处理方法、计算机程序和存储介质
JP2016004566A (ja) 提示情報制御装置、方法及びプログラム
WO2023175652A1 (ja) 動画生成装置、動画生成方法、および動画生成プログラム
CN110853130A (zh) 三维图像的生成方法、电子设备及存储介质
JP3932868B2 (ja) 画像配信システム