JP7316598B1

JP7316598B1 - サーバ

Info

Publication number: JP7316598B1
Application number: JP2023070727A
Authority: JP
Inventors: 綾子柳瀬
Original assignee: 17Live Japan Inc
Current assignee: 17Live Japan Inc
Priority date: 2023-04-24
Filing date: 2023-04-24
Publication date: 2023-07-28
Anticipated expiration: 2043-04-24

Abstract

【課題】動画の配信者の検索を改善する。【解決手段】サーバは、動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、動画データ保持部に保持される動画データをテキストデータに変換する変換部と、それぞれがテキストデータおよび配信者情報保持部に保持される配信者の前記情報を入力とし、配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、配信者を特定するＩＤと、複数の機械学習モデルにより出力された配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、検索要求に基づき文章保持部に対して検索を実行する検索部と、検索部により実行された検索の結果を、ユーザ端末にネットワークを介して提供する提供部と、を備える。【選択図】図１

Description

本開示は、サーバに関する。

ＩＴ技術の発展と共に情報のやりとりの様も移り変わってきた。昭和の時代には新聞やテレビなどの一方通行の情報伝達が主であった。平成になると、ケータイやパソコンが普及し、インターネットの通信速度も大きく改善されたので、チャットサービスなどの即時双方向通信サービスが台頭し、また記憶コストの低減に伴ってオンデマンド型の動画配信サービスが受け入れられていった。そして、現在、令和の時代となり、スマートフォンの高機能化や５Ｇに代表されるネットワークの速度のさらなる向上を受けて、動画によるリアルタイムのコミュニケーションを実現するサービス、特にライブ配信（Live Streaming）サービスが急速に認知度を高めている。ライブ配信サービスは、離れた場所にいても皆が同じ楽しい時間を共有できるサービスとして、若者を中心に利用者が拡大している。

ライブ配信プラットフォームでは、配信者は自分が好きなときにライブ配信を開始することができ、視聴者は自分の好きなときに興味のある配信者のライブ配信を視聴できる。特許文献１には、機械学習を用いてライブストリーミングコンテンツを推奨する技術が開示されている。

特表２０２０－５２１２０７号公報

「ChatGPTにギルガメッシュ王の人格を与えるには？」、深津貴之、URL:https://note.com/fladdict/n/neff2e9d52224 「画像の内容をAIが文章で答えるデモ」、株式会社エクサウィザーズ、URL:https://techblog.exawizards.com/entry/2019/02/15/175416 「文章間の類似度を測定する方法まとめ」、@shimi7o、URL:https://qiita.com/shimi7o/items/b3bc64e2fbe1103c7db9

ライブ配信の配信者に関する情報は、ライブ配信の動画データ（画像、音声）、配信者のプロフィール、フォロー関係を示すデータ、コメント履歴、視聴履歴、タグなど多種多様なデータを含む。このような多種多様なデータをまとめて検索の対象とすることができれば、配信者検索の精度を高めることができる。

本開示はこうした課題に鑑みてなされたものであり、その目的は、動画の配信者の検索を改善することができる技術の提供にある。

本発明のある態様は、サーバに関する。このサーバは、動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、動画データ保持部に保持される動画データをテキストデータに変換する変換部と、それぞれがテキストデータおよび配信者情報保持部に保持される配信者の前記情報を入力とし、配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、配信者を特定するＩＤと、複数の機械学習モデルにより出力された配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、検索要求に基づき文章保持部に対して検索を実行する検索部と、検索部により実行された検索の結果を、ユーザ端末にネットワークを介して提供する提供部と、を備える。

なお、以上の構成要素の任意の組み合わせや、本発明の構成要素や表現を装置、方法、システム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で相互に置換したものもまた、本発明の態様として有効である。

本発明によれば、動画の配信者の検索を改善することができる。

本開示の実施の形態に係るライブ配信システムの構成を示す模式図である。図１のユーザ端末の機能および構成を示すブロック図である。図１のサーバの機能および構成を示すブロック図である。図３のストリームＤＢの一例を示すデータ構造図である。図３のユーザＤＢの一例を示すデータ構造図である。図３のギフトＤＢの一例を示すデータ構造図である。図３の性格設定ＤＢの一例を示すデータ構造図である。図３の紹介文ＤＢの一例を示すデータ構造図である。サーバにおける配信者検索に係る一連の処理の流れを示すフローチャートである。アクティブユーザのユーザ端末のディスプレイに表示される検索受付画面の代表画面図である。アクティブユーザのユーザ端末のディスプレイに表示される検索結果画面の代表画面図である。本実施の形態に係る情報処理装置のハードウェア構成例を示すブロック図である。

以下、各図面に示される同一または同等の構成要素、部材、処理、信号には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面において説明上重要ではない部材の一部は省略して表示する。

実施の形態に係るライブ配信システムでは、配信者が行ったライブ配信のデータおよび当該配信者自身についての情報をＧＰＴ（Generative Pre-trained Transformer）などの生成系機械学習モデルに入力する。機械学習モデルは配信者を紹介する文章（以下、紹介文）を出力する。機械学習モデルには性格が設定され、性格が異なると同じ入力でも異なる紹介文が出力される。ライブ配信システムは、生成された紹介文を、配信者の検索のために使用する。

ライブ配信の配信者に係る情報はライブ配信の画像データや音声データ、コメント、ギフト、内容を示すタグ、配信者自身のプロフィール、フォロー関係など多岐に亘るところ、本実施の形態に係るライブ配信システムではそれらの情報が紹介文という形で一つにまとめられて検索の対象となる。したがって、検索が効率化され、検索の精度も向上する。さらに、機械学習モデルに設定された性格に応じて異なる紹介文が生成されるので、ユーザの気分や嗜好に沿った検索結果を提供することができる。

図１は、本開示の実施の形態に係るライブ配信システム１の構成を示す模式図である。ライブ配信システム１は、配信者（ライバー、ストリーマ（Streamer）ともいう）ＬＶと視聴者（オーディエンスともいう）ＡＵ（ＡＵ１、ＡＵ２、…）とがリアルタイムでやりとりできる双方向型のライブ配信サービスを提供する。図１に示すように、ライブ配信システム１は、サーバ１０と、配信者側のユーザ端末２０と、視聴者側のユーザ端末３０（３０ａ、３０ｂ、…）と、を備える。ライブ配信を配信している配信者、ライブ配信を視聴している視聴者の他に、ライブ配信プラットフォームにログインしたが配信も視聴もしていないユーザもいる。このようなユーザをアクティブユーザという。配信者、視聴者およびアクティブユーザをユーザと総称することがある。サーバ１０は、ネットワークＮＷに接続された一または複数の情報処理装置によって構成されてもよい。ユーザ端末２０、３０は例えばスマートフォンやタブレット型端末やラップトップＰＣやレコーダや携帯型ゲーム機やウェアラブル装置などの携帯端末であってもよいし、デスクトップＰＣなどの据え置き型の装置であってもよい。サーバ１０、ユーザ端末２０およびユーザ端末３０は、有線または無線の各種ネットワークＮＷにより互いに通信可能に接続される。

ライブ配信システム１には、配信者ＬＶと、視聴者ＡＵと、サーバ１０を管理する管理者（不図示）と、が関与する。配信者ＬＶは、自分の歌や、トーク、パフォーマンス、占い、ゲーム実況などのコンテンツを自身のユーザ端末２０で録音・録画してそのままサーバ１０にアップロードすることで、リアルタイムにコンテンツを発信する者である。管理者は、サーバ１０においてコンテンツのライブ配信のためのプラットフォームを提供し、また、配信者ＬＶと視聴者ＡＵとのリアルタイムのやりとりを仲介または管理する。視聴者ＡＵは、ユーザ端末３０でプラットフォームにアクセスして所望のコンテンツを選択し、視聴する。このコンテンツのライブ配信中に視聴者ＡＵがユーザ端末３０を介してコメントをしたり応援したり占いを依頼したりするための操作を行い、当該コンテンツを提供する配信者ＬＶがそのようなコメントや応援や依頼に反応し、当該反応が映像および／または音声で視聴者ＡＵに伝わることで、双方向のコミュニケーションが成立する。

本明細書において「ライブ配信」は、配信者ＬＶのユーザ端末２０で録音・録画されたコンテンツが実質的にリアルタイムで視聴者ＡＵのユーザ端末３０で再生され視聴可能となる状態を実現するデータの伝送態様を意味するものであってもよく、またはそのような伝送態様により実現される配信そのものを意味してもよい。ライブ配信は、HTTP Live StreamingやCommon Media Application FormatやWeb Real-Time CommunicationsやReal-Time Messaging ProtocolやMPEG DASHなどの既存のライブ配信技術を用いて実現されてもよい。ライブ配信は、配信者ＬＶがコンテンツを録音・録画しているときに、視聴者ＡＵが所定の遅延をもって当該コンテンツを視聴可能な伝送態様を含む。遅延の大きさについて、少なくとも、配信者ＬＶと視聴者ＡＵとのやりとりが成立する程度の大きさの遅延は許される。ただし、ライブ配信は、コンテンツを録音・録画したデータ全体をいったんサーバに保存し、その後の任意のタイミングでユーザからの求めに応じて当該データをサーバからユーザに提供するいわゆるオンデマンド型の配信とは区別される。

本明細書において「動画データ」は、ユーザ端末２０、３０の撮像機能により生成される画像データ（ビデオデータともいう）と、ユーザ端末２０、３０の音声入力機能により生成される音声データ（オーディオデータともいう）と、を含むデータである。動画データは、ユーザ端末２０、３０で再生されることで、ユーザによるコンテンツの視聴を可能とする。本実施の形態では、動画データが配信者のユーザ端末で生成されてから視聴者のユーザ端末で再生されるまでの間に、圧縮や伸張や符号化や復号やトランスコーディングなどの、データの形式やサイズや仕様を変更する処理が行われることが想定されている。このような処理の前後で動画データが表す内容（例えば、動画像や音声）は実質的に変わらないので、本実施の形態ではそのような処理が行われた後の動画データはそのような処理が行われる前の動画データと同じであるとして説明する。すなわち、動画データが配信者のユーザ端末で生成されてからサーバ１０を経由して視聴者のユーザ端末で再生される場合、配信者のユーザ端末で生成された動画データと、サーバ１０を通過する動画データと、視聴者のユーザ端末で受信されて再生される動画データと、は全て同じ動画データである。

本明細書において「配信時間」は、ひとつのライブ配信に関連付けられたパラメータであって、当該ライブ配信が継続した期間の長さを指す。配信時間は、当該ライブ配信に視聴者がいるか否かとは無関係に算出される。
本明細書において「総配信時間」は、配信者に関連付けられたパラメータであって、所定の期間において対象の配信者が行ったライブ配信の配信時間を通算することで得られる時間である。

図１の例では、配信者ＬＶがトークをライブ配信している。配信者ＬＶのユーザ端末２０はトークを行っている配信者ＬＶの像および音声を録画・録音することで動画データを生成し、ネットワークＮＷを介してサーバ１０に送信する。併せてユーザ端末２０は、録画された配信者ＬＶの動画像ＶＤをユーザ端末２０のディスプレイに表示させることで、配信者ＬＶによる配信内容の確認を可能とする。

配信者ＬＶのライブ配信の視聴をプラットフォームに要求した視聴者ＡＵ１、ＡＵ２のユーザ端末３０ａ、３０ｂはそれぞれ、ネットワークＮＷを介してライブ配信に係る動画データを受信し、受信した動画データを再生することでディスプレイに動画像ＶＤ１、ＶＤ２を表示させると共にスピーカーから音声を出力する。各ユーザ端末３０ａ、３０ｂで表示される動画像ＶＤ１、ＶＤ２は配信者ＬＶのユーザ端末２０が撮像した動画像ＶＤと実質的に同一であり、各ユーザ端末３０ａ、３０ｂで出力される音声も配信者ＬＶのユーザ端末２０が録音した音声と実質的に同一である。

配信者ＬＶのユーザ端末２０における録音・録画と、視聴者ＡＵ１、ＡＵ２のユーザ端末３０ａ、３０ｂにおける動画データの再生と、は実質的に同時に行われる。配信者ＬＶのトークの内容についてひとりの視聴者ＡＵ１がコメントをユーザ端末３０ａに入力すると、サーバ１０は当該コメントをリアルタイムで配信者ＬＶのユーザ端末２０に表示させると共に各視聴者ＡＵ１、ＡＵ２のユーザ端末３０ａ、３０ｂにも表示させる。当該コメントを読んだ配信者ＬＶがその内容に被せたトークを展開すると、そのトークの動画像と音声が各視聴者ＡＵ１、ＡＵ２のユーザ端末３０ａ、３０ｂで出力され、これにより配信者ＬＶと視聴者ＡＵ１との会話が成立したと認識される。このように、ライブ配信システム１では、一方通行でない双方向のコミュニケーションを可能とするライブ配信が実現される。

図２は、図１のユーザ端末２０の機能および構成を示すブロック図である。ユーザ端末３０はユーザ端末２０と同様の機能および構成を有する。図２および以後のブロック図に示す各ブロックは、ハードウェア的には、コンピュータのＣＰＵをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組み合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解されるところである。

配信者ＬＶおよび視聴者ＡＵは、ダウンロードサイトからネットワークＮＷを介して、本実施の形態に係るライブ配信アプリケーションプログラム（以下、ライブ配信アプリという）をユーザ端末２０、３０にダウンロードし、インストールする。あるいはまた、ライブ配信アプリはユーザ端末２０、３０にプリインストールされていてもよい。ライブ配信アプリがユーザ端末２０、３０により実行されることにより、ユーザ端末２０、３０はネットワークＮＷを介してサーバ１０と通信し、各種機能を実現する。以下、ユーザ端末２０、３０（のＣＰＵなどのプロセッサ）がライブ配信アプリを実行することにより実現する機能をユーザ端末２０、３０の機能として説明する。それらの機能は実際はライブ配信アプリがユーザ端末２０、３０に実現させる機能である。なお、他の実施の形態では、これらの機能は、サーバ１０からユーザ端末２０、３０のウェブブラウザにネットワークＮＷを介して送信され、そのウェブブラウザによって実行される、ＨＴＭＬ（HyperText Markup Language）などのプログラミング言語により記述されたコンピュータプログラムにより実現されてもよい。

ユーザ端末２０は、ユーザの像および音声を記録した動画データを生成してサーバ１０に提供する配信部１００と、サーバ１０から動画データを取得して再生する視聴部２００と、アクティブユーザによる要求を処理する配信外処理部４００と、を備える。ユーザは、配信を行う場合は配信部１００を、視聴を行う場合は視聴部２００を、視たいライブ配信を探したり配信者のプロフィールを視たりアーカイブを視たりする場合は配信外処理部４００を、それぞれ起動する。配信部１００がアクティブとなっているユーザ端末は配信者側、つまり動画データの生成側のユーザ端末であり、視聴部２００がアクティブとなっているユーザ端末は視聴者側、つまり動画データの再生側のユーザ端末であり、配信外処理部４００がアクティブとなっているユーザ端末はアクティブユーザのユーザ端末である。

配信部１００は、撮像制御部１０２と、音声制御部１０４と、動画送信部１０６と、配信側ＵＩ制御部１０８と、配信側通信部１１０と、を含む。撮像制御部１０２は図２では不図示のカメラと接続され、カメラによる撮像を制御する。撮像制御部１０２はカメラから画像データを取得する。音声制御部１０４は図２では不図示のマイクロフォンと接続され、マイクロフォンによる音声入力を制御する。音声制御部１０４は、マイクロフォンから音声データを取得する。動画送信部１０６は、撮像制御部１０２により取得された画像データおよび音声制御部１０４により取得された音声データを含む動画データを、ネットワークＮＷを介してサーバ１０に送信する。動画送信部１０６による動画データの送信はリアルタイムで行われる。すなわち、撮像制御部１０２および音声制御部１０４による動画データの生成と、生成された動画データの動画送信部１０６による送信と、は実質的に同時に行われる。

配信側ＵＩ制御部１０８は、配信者向けのＵＩを制御する。配信側ＵＩ制御部１０８は、図２では不図示のディスプレイと接続され、動画送信部１０６による送信対象となっている動画データを再生することにより動画像をディスプレイに表示させる。配信側ＵＩ制御部１０８は、図２では不図示のタッチパネルやキーボードやディスプレイなどの入力手段と接続され、それら入力手段を介して配信者による入力を取得する。配信側ＵＩ制御部１０８は、動画像に所定のフレーム画像を重畳させる。フレーム画像は、配信者から入力を受け付けるための様々なユーザインタフェースオブジェクト（以下、単にオブジェクトという）と、視聴者により入力されたコメントと、サーバ１０から取得した情報と、を含む。配信側ＵＩ制御部１０８は例えば配信者によるオブジェクトに対するタップ入力を受け付ける。

配信側通信部１１０は、ライブ配信中のサーバ１０との間の通信を制御する。配信側通信部１１０は、配信側ＵＩ制御部１０８が取得した配信者による入力の内容を、サーバ１０にネットワークＮＷを介して送信する。配信側通信部１１０は、ライブ配信に関連付けられた各種の情報をサーバ１０からネットワークＮＷを介して受信する。

視聴部２００は、視聴側ＵＩ制御部２０２と、視聴側通信部２０４と、を含む。視聴側通信部２０４は、ライブ配信中のサーバ１０との間の通信を制御する。視聴側通信部２０４は、ネットワークＮＷを介してサーバ１０から、配信者と視聴者とが参加するライブ配信に係る動画データを受信する。

視聴側ＵＩ制御部２０２は、視聴者向けのＵＩを制御する。視聴側ＵＩ制御部２０２は、図２では不図示のディスプレイおよびスピーカと接続され、受信された動画データを再生することにより動画像をディスプレイに表示させると共に音声をスピーカから出力させる。ディスプレイに画像が出力されると共にスピーカから音声が出力されることを、合わせて「動画データが再生」されていると言うことができる。視聴側ＵＩ制御部２０２は、図２では不図示のタッチパネルやキーボードやディスプレイなどの入力手段と接続され、それら入力手段を介して視聴者による入力を取得する。視聴側ＵＩ制御部２０２は、サーバ１０から取得された動画データの画像に所定のフレーム画像を重畳させる。フレーム画像は、視聴者から入力を受け付けるための様々なオブジェクトと、視聴者により入力されたコメントと、サーバ１０から取得した情報と、を含む。視聴側通信部２０４は、視聴側ＵＩ制御部２０２が取得した視聴者による入力の内容を、ネットワークＮＷを介してサーバ１０に送信する。

配信外処理部４００は、配信外ＵＩ制御部４０２と、配信外通信部４０４と、を含む。配信外ＵＩ制御部４０２は、アクティブユーザ向けのＵＩを制御する。例えば、配信外ＵＩ制御部４０２は、現在参加可能なライブ配信のリストを表示してアクティブユーザによるライブ配信の選択を受け付けるライブ配信選択画面を生成し、ディスプレイに表示させる。配信外ＵＩ制御部４０２は、任意のユーザのプロフィール画面を生成し、ディスプレイに表示させる。配信外ＵＩ制御部４０２は、配信者を検索するための検索キーワードを受け付ける検索画面を生成し、ディスプレイに表示させる。配信外ＵＩ制御部４０２は、配信者の検索結果を含む検索結果表示画面を生成し、ディスプレイに表示させる。配信外ＵＩ制御部４０２は、過去のライブ配信を録音・録画することにより生成されたアーカイブを再生する。

配信外通信部４０４は、ライブ配信外のサーバ１０との間の通信を制御する。配信外通信部４０４は、ネットワークＮＷを介してサーバ１０から、ライブ配信選択画面を生成するための情報や、配信者の検索結果や、プロフィール画面を生成するための情報や、アーカイブのデータを受信する。配信外通信部４０４は、アクティブユーザによる入力の内容を、ネットワークＮＷを介してサーバ１０に送信する。

図３は、図１のサーバ１０の機能および構成を示すブロック図である。サーバ１０は、配信情報提供部３０２と、中継部３０４と、ギフト処理部３０８と、支払い処理部３１０と、ストリームＤＢ３１４と、ユーザＤＢ３１８と、ギフトＤＢ３２０と、配信者検索部３２２と、紹介文生成部３２４と、性格設定ＤＢ３２６と、紹介文ＤＢ３２８と、を備える。

図４は、図３のストリームＤＢ３１４の一例を示すデータ構造図である。ストリームＤＢ３１４は現在行われているライブ配信の情報および過去に行われたライブ配信（アーカイブ）の情報を保持する。特にストリームＤＢ３１４は、配信者により配信される動画の画像および音声を含む動画データを保持する。ストリームＤＢ３１４は、ライブ配信システム１が提供するライブ配信プラットフォームにおいてライブ配信を特定するストリームＩＤと、当該ライブ配信の配信者を特定するユーザＩＤである配信者ＩＤと、当該ライブ配信の視聴者を特定するユーザＩＤである視聴者ＩＤと、当該ライブ配信の開始時刻と、当該ライブ配信の終了時刻（アーカイブの場合）と、当該ライブ配信の内容を表す配信内容タグと、当該ライブ配信の画像データと、当該ライブ配信の音声データと、当該ライブ配信で投稿されたコメントの履歴と、当該ライブ配信で使用されたギフトの履歴と、を対応付けて保持する。

本実施の形態に係るライブ配信システム１が提供するライブ配信プラットフォームでは、ユーザがライブ配信を行う場合そのユーザは配信者となり、また同じユーザが他のユーザが配信するライブ配信を視聴する場合は視聴者となる。したがって、配信者・視聴者の別は固定的なものではなく、あるとき配信者ＩＤとして登録されていたユーザＩＤが別のタイミングでは視聴者ＩＤとして登録されることもある。

ライブ配信の内容タグは、配信者がライブ配信を始める際に指定したタグであってもよいし、機械学習により生成されたモデルがライブ配信をリアルタイムで解析することで得られるタグであってもよい

図５は、図３のユーザＤＢ３１８の一例を示すデータ構造図である。ユーザＤＢ３１８は、ユーザに関する情報を保持する。特にユーザＤＢ３１８は、ライブ配信プラットフォームで配信される動画の配信者の情報を保持する。ユーザＤＢ３１８は、ユーザを特定するユーザＩＤと、当該ユーザが有しているポイントと、当該ユーザに付与された報酬と、当該ユーザのレベルと、当該ユーザの年齢の範囲と、当該ユーザの性別と、当該ユーザの髪の色と、当該ユーザがライブ配信アプリを使用している地域を示すリージョンと、当該ユーザに付されたユーザタグと、当該ユーザがライブ配信プラットフォームに登録した日付である登録日と、当該ユーザの総配信時間である配信時間累計と、当該ユーザがライブ配信プラットフォームに登録した自身のプロフィール画像と、当該ユーザがフォローしている他のユーザのユーザＩＤと、当該ユーザをフォローしている他のユーザのユーザＩＤと、当該ユーザが他の配信者のライブ配信やプロフィールを閲覧した履歴と、当該ユーザのコメントの履歴と、当該ユーザのログインの頻度と、当該ユーザの月間の消費ポイントと、当該ユーザの自己紹介と、を含む。

ポイントは、ライブ配信プラットフォーム内で流通する電子的価値である。ユーザはクレジットカードや他の決済手段によりポイントを購入する。報酬はライブ配信プラットフォーム内で定義される電子的価値であり、配信者がライブ配信プラットフォームの管理者から受け取る金銭の額を決めるための指標である。ライブ配信プラットフォームでは、ライブ配信内やライブ配信外で視聴者が配信者にギフトを贈ると、視聴者のポイントが消費され、併せて配信者の報酬が相応分だけ増加する。

レベルは、ライブ配信プラットフォームにおけるユーザの配信者としての実績を示す指標である。他の実施の形態では、レベルは、ライブ配信プラットフォームにおけるユーザの視聴者としての実績を示す指標であってもよいし、ユーザの配信者および視聴者の両方としての実績を示す指標であってもよい。レベルは、ライブ配信を行った回数、ライブ配信の配信時間、ギフトを贈った回数および／または量、ギフトをもらった回数および／または量、コメントの回数などに応じて増減してもよい。あるいはまた、レベルは、配信者に対するレビューやユーザ満足度や配信内のコメントを基に管理者により評価、決定されてもよい。あるいはまた、レベルは、所定のルールまたは機械学習モデルにより自動的に決定されてもよい。

図６は、図３のギフトＤＢ３２０の一例を示すデータ構造図である。ギフトＤＢ３２０は、ライブ配信において視聴者が使用可能なギフトに関する情報を保持する。ギフトは、以下の特徴を有する電子データである。
・ポイントや金銭を対価として購入可能、または無料で付与可能。
・視聴者が配信者に贈ることができるもの。配信者にギフトを贈ることを、ギフトを使用する、またはギフトを投げるともいう。
・ギフトの購入と使用とがセットで同時に発生するタイプのものもあれば、購入した後、視聴者が任意のタイミングで使用可能なタイプのものもある。
・視聴者が配信者にギフトを贈ると、その配信者に相応の報酬が付与される。
・ギフトが使用された場合、ギフトに関連付けられた効果が生じることがある。例えば、ギフトに対応するエフェクトがライブ配信ルーム画面に表れる。

ギフトＤＢ３２０は、ギフトを特定するギフトＩＤと、当該ギフトを配信者に贈った場合に当該配信者に付与される報酬である付与報酬と、当該ギフトを使用する際に支払うべき対価である対価ポイントと、を対応付けて保持する。視聴者は、ライブ配信の視聴中に、所望のギフトの対価ポイントを支払うことで配信者に当該ギフトを贈ることができる。この対価ポイントの支払いは適宜の電子的決済手段により行われてもよく、例えば対価ポイントを視聴者が管理者に支払うことで行われてもよい。あるいはまた、銀行振込やクレジットカードによる支払いが用いられてもよい。付与報酬と対価ポイントとの関係は管理者が任意に設定可能である。例えば、付与報酬＝対価ポイントに設定してもよい。または付与報酬に１．２などの所定の係数を乗じて得られるポイントを対価ポイントに設定してもよいし、付与報酬に所定の手数料ポイントを加算して得られるポイントを対価ポイントに設定してもよい。

図７は、図３の性格設定ＤＢ３２６の一例を示すデータ構造図である。本実施の形態では紹介文を生成する機械学習モデルとしてｏｐｅｎＡＩ社が提供するＧＰＴ－３、ＧＰＴ－３．５、ＧＰＴ－４等の生成系機械学習モデル（以下、単にモデルという場合がある）を用いる。モデルのプロンプトに制約条件や行動指針を入力することで、モデルに性格を設定することができる（例えば、非特許文献１参照）。性格設定ＤＢ３２６は、モデルに設定する性格を特定する性格ＩＤと、当該性格に対応するプロンプトと、を対応付けて保持する。本実施の形態では５種類の性格に対応する５つのプロンプトを設けるが、これに限られず、性格の数や内容は任意に設定可能である。

図８は、図３の紹介文ＤＢ３２８の一例を示すデータ構造図である。紹介文ＤＢ３２８は、紹介対象の配信者の配信者ＩＤと、モデルに設定された性格を特定する性格ＩＤと、当該モデルにより出力されたキャッチコピーと、当該モデルにより出力された紹介文と、を対応付けて保持する。本実施の形態では５つの異なるプロンプトにより設定された５つのモデルがあるので、ひとつの配信者ＩＤに対して５つの紹介文が対応付けられる。

図３に戻り、紹介文生成部３２４は、ストリームＤＢ３１４およびユーザＤＢ３１８を参照することで、各配信者に対して複数の紹介文を生成し、生成された紹介文を紹介文ＤＢ３２８に登録する。紹介文生成部３２４は、それぞれに異なる性格が設定された複数のモデルを含む。紹介文生成部３２４は、変換部３３８と、第１紹介文章生成モデル３４０と、第２紹介文章生成モデル３４２と、第３紹介文章生成モデル３４４と、第４紹介文章生成モデル３４６と、第５紹介文章生成モデル３４８と、を含む。

変換部３３８は、ストリームＤＢ３１４に保持される動画データをテキストデータに変換する。画像データをその内容を表すテキストデータに変換するために、公知の画像解析技術を用いてもよい（例えば、非特許文献２参照）。音声データをテキストに変換するために、公知のＳＴＴ（Speech to Text）技術を用いてもよい。

第１紹介文章生成モデル３４０は、図７の性格設定ＤＢ３２６の性格ＩＤ「ＣＨ１」で特定される性格が設定されたモデルである。第１紹介文章生成モデル３４０は、デフォルトのモデルに、図７の性格設定ＤＢ３２６の性格ＩＤ「ＣＨ１」に対応するプロンプトを入力することによって生成される。このモデルの生成は、ライブ配信プラットフォームの管理者によって手動で行われてもよいし、紹介文生成部３２４により性格設定ＤＢ３２６を参照することで自動で行われてもよい。

第１紹介文章生成モデル３４０は、配信者のライブ配信の動画データを変換したテキストデータおよびユーザＤＢ３１８に保持される当該配信者の情報を入力とし、当該配信者のキャッチコピーおよび紹介文を出力とする。

第２紹介文章生成モデル３４２、第３紹介文章生成モデル３４４、第４紹介文章生成モデル３４６、第５紹介文章生成モデル３４８はそれぞれ、図７の性格設定ＤＢ３２６の性格ＩＤ「ＣＨ２」、「ＣＨ３」、「ＣＨ４」、「ＣＨ５」で特定される性格が設定されたモデルである。第２紹介文章生成モデル３４２、第３紹介文章生成モデル３４４、第４紹介文章生成モデル３４６、第５紹介文章生成モデル３４８はいずれも、配信者のライブ配信の動画データを変換したテキストデータおよびユーザＤＢ３１８に保持される当該配信者の情報を入力とし、当該配信者のキャッチコピーおよび紹介文を出力とする。

配信者検索部３２２は、アクティブユーザのユーザ端末から配信者の検索要求を受けると、紹介文ＤＢ３２８を検索し、検索の結果を当該ユーザ端末に返す。配信者検索部３２２は、検索要求受付部３３０と、求人文章生成モデル３３２と、検索部３３４と、提供部３３６と、を含む。

検索要求受付部３３０は、ライブ配信プラットフォームのアクティブユーザのユーザ端末からネットワークＮＷを介して、検索要求を受け付ける。検索要求は、要求元のアクティブユーザのユーザＩＤと、当該アクティブユーザが指定した性格の性格ＩＤと、当該アクティブユーザが入力した検索対象のキーワード（以下、検索キーワードという）と、を含む。

検索部３３４は、受け付けられた検索要求に基づき紹介文ＤＢ３２８に対して検索を実行する。

提供部３３６は、検索部３３４により実行された検索の結果を、要求元のユーザ端末にネットワークＮＷを介して提供する。

配信者検索部３２２では、以下の４つのモードでの配信者検索が可能となっている。
（１）キーワード検索、性格設定無し
（２）キーワード検索、性格設定有り
（３）文章マッチング検索、性格設定無し
（４）文章マッチング検索、性格設定有り
性格設定有りの場合、検索キーワードが同じでも性格が異なると検索結果も異なる場合がある。

（１）キーワード検索、性格設定無しのモード
検索部３３４は、受け付けられた検索要求に含まれる検索キーワードをキーとして紹介文ＤＢ３２８に保持される紹介文を検索し、マッチングスコアの高い方から所定の数の配信者ＩＤを検索結果として取得する。検索キーワードをキーとする文章検索の技術は公知であるから本明細書では詳述しない。

検索部３３４は、検索要求に含まれる検索キーワードから推定により新たな検索キーワードを生成してもよい。一例として、検索要求に含まれる検索キーワードが「ギター初心者」および「XX」（アーティスト名）である場合、ワード推定により「ギター初心者」、「ギター弾き方入門」、「ギターの練習方法」、「ギターのコード」、「XXの曲のギターコード」、「オンラインギターレッスン」が生成され、検索キーワードに追加される。また、形容詞付き推定を用いる場合、「初心者向けギターレッスン」、「楽しくギターを学ぶ方法」、「ゆっくりと学ぶギターレッスン」、「信頼できる情報源ギターレッスン」、「XXのギターTAB譜」、「初心者におすすめのXX曲」が生成され、検索キーワードに追加される。

提供部３３６は、検索部３３４によって取得された配信者ＩＤのそれぞれについて、ストリームＤＢ３１４を参照することで当該配信者ＩＤで特定される配信者が現在行っているライブ配信の情報（以下、ライブ配信情報という）および当該配信者ＩＤが行った過去のライブ配信のアーカイブの情報（以下、アーカイブ情報という）を取得する。提供部３３６は、検索部３３４によって取得された配信者ＩＤと、当該配信者ＩＤに対して取得されたライブ配信情報およびアーカイブ情報と、を含む検索結果リストを生成する。提供部３３６は、生成した検索結果リストを、ネットワークＮＷを介して要求元のユーザ端末に送信する。

（２）キーワード検索、性格設定有りのモード
検索部３３４は、紹介文ＤＢ３２８に保持される紹介文のうち受け付けられた検索要求に含まれる性格ＩＤに対応する紹介文を特定する。検索部３３４は、受信された検索要求に含まれる検索キーワードをキーとして、上記で特定された紹介文を検索し、マッチングスコアの高い方から所定の数の配信者ＩＤを検索結果として取得する。以降の処理は（１）のモードのそれに準じる。

（３）文章マッチング検索、性格設定無し
求人文章生成モデル３３２は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報を入力とし、当該アクティブユーザの要望を表す文章（以下、探索文という）を出力とする。求人文章生成モデル３３２は、探索文として以下の２通りの文章を生成することができる。
（Ａ）要求元のアクティブユーザが望んでいるであろう配信者のプロフィール
（Ｂ）要求元のアクティブユーザが配信者に求める人物像を記載した文章

（Ａ）について、求人文章生成モデル３３２は、ユーザＤＢ３１８を参照し、検索要求に含まれるユーザＩＤに対応する情報を要求元のアクティブユーザの情報として取得する。求人文章生成モデル３３２は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報から、当該アクティブユーザが望んでいるであろう配信者のプロフィールを生成する。プロフィールはユーザＩＤとプロフィール画像と自己紹介とを含む。以下にそのように生成されたプロフィールの一例を示す。
「ユーザＩＤ：HHH
プロフィール画像：「鮮やかなピンク色の背景に、ギターを持った女性のイラスト」
自己紹介：音楽大好きな女子高生です！流行に敏感で、常に新しい音楽にチャレンジしています！ギターを弾くのも大好きです！みんなで音楽の話しましょう。好きな音楽ジャンルはロック、ポップス、EDMです。趣味は音楽鑑賞、ギター弾き語り、コンサート参戦、SNSで音楽について語ることです。好きなアーティストはXX、YYです。」

求人文章生成モデル３３２は、生成されたプロフィールに基づき、アクティブユーザが望んでいるであろう配信者が好きそうな人物の推測と簡易説明を生成し、プロフィールに追加してもよい。。以下にそのように生成された推測および簡易説明の一例を示す。
「XX：キャッチーなメロディーとストーリー性のある歌詞が特徴的なポップカントリーシンガーソングライターです。
YY：独自のスタイルとパーソナルな歌詞、ダークな雰囲気が特徴の若手シンガーソングライターです。
KK：ギターを使ったアコースティックな楽曲が人気のシンガーソングライターで、メロディーや歌詞が心に残ります。
LL：高い音域とパワフルなボーカルが印象的なポップシンガーで、エモーショナルな歌詞も魅力的です。
PP：ファンキーなビートとリズミカルなメロディーが特徴的なポップR&Bシンガーで、楽しいパフォーマンスも魅力です。」

（Ｂ）について、求人文章生成モデル３３２は、検索要求に含まれる検索キーワードおよび要求元のアクティブユーザの情報から、要求元のアクティブユーザが配信者に求める人物像を記載した文章を生成する。以下にそのような文章の例を示す。
「ギターを弾くのが楽しいけど、なかなか上達できなくて悩んでいます。もっと上手になりたいけど、何をすればいいか分かりません。どうやったらもっと練習が効率的になるのか、もっと技術を磨くことができるのか知りたいです。とにかく、XXの曲を弾きたいんだけど、難しくて挫折しそうになっています。もっと分かりやすい方法や、コツがあったら教えてほしいです。」
「初心者でギターの練習方法が分からなくて困っています。XXの曲が弾きたいんですが、難しくて挫折しそうになっています。どうやったらもっと簡単に、でも上手に弾けるようになるのか知りたいです。特に、LLとYMを弾きたいと思っています。初心者向けの練習方法や、コード進行を覚えるコツなど、アドバイスがほしいです。また、オンラインでギターレッスンを受けられるサイトなど、おすすめがあれば教えてください。」

検索部３３４は、求人文章生成モデル３３２により出力された探索文と紹介文ＤＢ３２８に保持される紹介文とを比較することにより検索を実行する。検索部３３４は、探索文と、紹介文ＤＢ３２８に保持される紹介文のそれぞれと、の類似度を算出する。文章と文章との類似度の算出は、例えば重要単語の数の一致や出現ワードの類似数やＴＦ－ＩＤＦ（term frequency - inverse document frequency）などを基に実現されてもよく、または例えば非特許文献３に記載されるような比較技術を用いて実現されてもよい。検索部３３４は算出された類似度が高い方から所定の数の配信者ＩＤを検索結果として取得する。提供部３３６の処理は（１）のモードのそれに準じる。

（４）文章マッチング検索、性格設定有り
求人文章生成モデル３３２に、受け付けられた検索要求に含まれる性格ＩＤ（図７の性格設定ＤＢ３２６の性格ＩＤ「ＣＨ１」、「ＣＨ２」、「ＣＨ３」、「ＣＨ４」、「ＣＨ５」のうちのひとつ）で特定される性格が設定される。求人文章生成モデル３３２は、デフォルトのモデルに、検索要求に含まれる性格ＩＤに対応するプロンプトを入力することによって生成される。配信者検索部３２２は、検索要求を受け付けると、性格設定ＤＢ３２６を参照して自動でそのような求人文章生成モデル３３２の生成を行う。以降の処理は（３）のモードのそれに準じる。

あるいはまた、検索部３３４は、探索文と、紹介文ＤＢ３２８に保持される紹介文のうち検索要求に含まれる性格ＩＤに対応する紹介文のそれぞれと、の類似度を算出してもよい。性格設定を探索文の生成に反映させるか、紹介文の絞り込みに適用するか、は適宜管理者により設定可能である。

検索要求の要求元のユーザ端末の配信外ＵＩ制御部４０２は、受信した検索結果リストに基づいて検索結果画面を生成し、ユーザ端末のディスプレイに表示させる。配信外ＵＩ制御部４０２は、検索結果画面におけるアクティブユーザによるライブ配信の選択を受け付けると、選択されたライブ配信のストリームＩＤを含む配信要求を生成し、ネットワークＮＷを介してサーバ１０に送信する。配信情報提供部３０２は、受信した配信要求に含まれるストリームＩＤにより特定されるライブ配信の、要求元のユーザ端末への提供を開始する。配信情報提供部３０２は、当該ストリームＩＤの視聴者ＩＤに要求元のユーザ端末のアクティブユーザのユーザＩＤが含まれるようにストリームＤＢ３１４を更新する。これにより、アクティブユーザは選択されたライブ配信の視聴者となる。

中継部３０４は、配信情報提供部３０２によって開始されたライブ配信において、配信者のユーザ端末２０から視聴者のユーザ端末３０への動画データの伝送を中継する。中継部３０４は、ライブ配信中すなわち動画データの再生中における視聴者によるユーザ入力を示す信号を視聴側通信部２０４から受信する。ユーザ入力を示す信号は、ユーザ端末３０のディスプレイに表示されたオブジェクトの指定を示すオブジェクト指定信号であってもよく、当該オブジェクト指定信号は、視聴者の視聴者ＩＤと、視聴者が視聴しているライブ配信を行っている配信者の配信者ＩＤと、オブジェクトを特定するオブジェクトＩＤと、を含む。オブジェクトがギフトアイコンである場合、オブジェクトＩＤはギフトＩＤとなる。その場合のオブジェクト指定信号は、視聴者による配信者に対するギフトの使用を示すギフト使用信号となる。同様に、中継部３０４は、動画データの再生中における配信者によるユーザ入力を示す信号、例えばオブジェクト指定信号をユーザ端末２０の配信部１００の配信側通信部１１０から受信する。

ギフト処理部３０８は、ギフト使用信号に含まれるギフトＩＤで特定されるギフトの付与報酬に応じて配信者の報酬を増加させるようにユーザＤＢ３１８を更新する。ギフト処理部３０８は、ギフトＤＢ３２０を参照し、受信したギフト使用信号に含まれるギフトＩＤに対応する付与報酬を特定する。ギフト処理部３０８は、ギフト使用信号に含まれる配信者ＩＤに対応する報酬に、特定された付与報酬を加えるようユーザＤＢ３１８を更新する。

支払い処理部３１０は、ギフト使用信号の受信に応じて、視聴者によるギフトの対価の支払いを処理する。支払い処理部３１０は、ギフトＤＢ３２０を参照し、ギフト使用信号に含まれるギフトＩＤで特定されるギフトの対価ポイントを特定する。支払い処理部３１０は、ギフト使用信号に含まれる視聴者ＩＤで特定される視聴者のポイントから特定された対価ポイントを差し引くようユーザＤＢ３１８を更新する。

以上の構成によるライブ配信システム１の動作を説明する。
図９は、サーバ１０における配信者検索に係る一連の処理の流れを示すフローチャートである。サーバ１０は、ストリームＤＢ３１４に保持されている配信者のライブ配信の動画データをテキストデータに変換する（Ｓ２０２）。サーバ１０は、紹介文章生成モデルごとに以下のステップＳ２０４、Ｓ２０６の処理を繰り返す。サーバ１０は、テキストデータおよび配信者の情報を紹介文章生成モデルに入力する（Ｓ２０４）。サーバ１０は、紹介文章生成モデルが出力するキャッチコピーおよび紹介文を紹介文ＤＢ３２８に登録する（Ｓ２０６）。

サーバ１０は、ネットワークＮＷを介してユーザ端末から検索要求を受け付ける（Ｓ２０８）。サーバ１０は、検索要求に含まれる検索キーワードおよび検索要求者の情報を求人文章生成モデル３３２に入力する（Ｓ２１０）。サーバ１０は、求人文章生成モデル３３２が出力する探索文と紹介文ＤＢ３２８に保持される紹介文とを比較することで、配信者の検索を実行する（Ｓ２１２）。サーバ１０は、検索の結果得られた配信者の情報および当該配信者が行なっているライブ配信およびアーカイブの情報を、検索要求者のユーザ端末に送信する（Ｓ２１４）。

図１０は、アクティブユーザのユーザ端末のディスプレイに表示される検索受付画面６００の代表画面図である。検索受付画面６００は、アクティブユーザによるキーワードの入力を自由入力形式で受け付けるキーワード入力領域６０２と、アクティブユーザによる性格の指定をプルダウン形式で受け付ける性格指定領域６０４と、検索ボタン６０６と、を有する。

アクティブユーザは、所望のキーワードをキーワード入力領域６０２に入力し、所望の性格を性格指定領域６０４で選択し、検索ボタン６０６を押す。ユーザ端末の配信外通信部４０４は、検索ボタン６０６の押下を検出すると、キーワード入力領域６０２に入力されたキーワードと、性格指定領域６０４で選択された性格の性格ＩＤと、アクティブユーザのユーザＩＤと、を含む検索要求を生成し、ネットワークＮＷを介してサーバ１０に送信する。

図１１は、アクティブユーザのユーザ端末のディスプレイに表示される検索結果画面６１０の代表画面図である。配信外通信部４０４は、図１０の検索受付画面６００を介して送信された検索要求に対応する検索結果リストをサーバ１０から受信する。配信外ＵＩ制御部４０２は、受信した検索結果リストに基づいて検索結果画面６１０を生成し、ディスプレイに表示させる。検索結果画面６１０は、検索結果リストに含まれる配信者ＩＤ６１２と、当該配信者ＩＤで特定される配信者が現在行なっているライブ配信を表すサムネイル６１４と、当該配信者の過去のライブ配信のアーカイブを表すサムネイル６１６と、を含む。

上述の実施の形態において、保持部の例は、ハードディスクや半導体メモリである。また、本明細書の記載に基づき、各部を、図示しないＣＰＵや、インストールされたアプリケーションプログラムのモジュールや、システムプログラムのモジュールや、ハードディスクから読み出したデータの内容を一時的に記憶する半導体メモリなどにより実現できることは本明細書に触れた当業者には理解される。

本実施の形態に係るライブ配信システム１によると、配信者ごとに紹介文が生成されて紹介文ＤＢ３２８に登録される。配信者を検索する際には紹介文ＤＢ３２８に保持される紹介文が使用される。動画データやプロフィールなど配信者に関する多種多様な情報をひとつにまとめた紹介文を検索するように構成したことで、検索の精度を高めることができ、および／または検索のスピードを向上することができる。

また、本実施の形態に係るライブ配信システム１では、異なる性格を有する異なるモデルを用いて、同じ配信者に対して複数の紹介文を生成する。これにより、配信者の検索を行なうアクティブユーザの希望により沿った検索結果を提供することができる。さらに、アクティブユーザの側でも希望の性格を指定することにより、検索結果の精度がより向上する。

図１２を参照して、本実施の形態に係る情報処理装置のハードウェア構成について説明する。図１２は、本実施の形態に係る情報処理装置のハードウェア構成例を示すブロック図である。図示された情報処理装置９００は、例えば、本実施の形態におけるサーバ１０およびユーザ端末２０、３０のそれぞれを実現しうる。

情報処理装置９００は、ＣＰＵ９０１、ＲＯＭ（Read Only Memory）９０２、およびＲＡＭ（Random Access Memory）９０３を含む。また、情報処理装置９００は、ホストバス９０７、ブリッジ９０９、外部バス９１１、インタフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２５、通信装置９２９を含んでもよい。さらに、情報処理装置９００は、カメラなどの撮像装置（不図示）を含む。また、情報処理装置９００は、ＣＰＵ９０１に代えて、またはこれとともに、ＤＳＰ（Digital Signal Processor）またはＡＳＩＣ（Application Specific Integrated Circuit）と呼ばれるような処理回路を有してもよい。

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、ＲＯＭ９０２、ＲＡＭ９０３、ストレージ装置９１９、またはリムーバブル記録媒体９２３に記録された各種プログラムに従って、情報処理装置９００内の動作全般またはその一部を制御する。例えば、ＣＰＵ９０１は、本実施の形態におけるサーバ１０およびユーザ端末２０、３０のそれぞれに含まれる各機能部の動作全般を制御する。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータなどを記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータなどを一次記憶する。ＣＰＵ９０１、ＲＯＭ９０２、およびＲＡＭ９０３は、ＣＰＵバスなどの内部バスにより構成されるホストバス９０７により相互に接続されている。さらに、ホストバス９０７は、ブリッジ９０９を介して、ＰＣＩ（Peripheral Component Interconnect/Interface）バスなどの外部バス９１１に接続されている。

入力装置９１５は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなど、ユーザによって操作される装置であってもよいし、マイクロフォンなどの音センサ、加速度センサ、傾きセンサ、赤外線センサ、深度センサ、温度センサ、湿度センサなど物理量を電気信号に変換する装置であってもよい。入力装置９１５は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置９００の操作に対応した携帯電話などの外部接続機器９２７であってもよい。入力装置９１５は、ユーザが入力した情報または感知した物理量に基づいて入力信号を生成してＣＰＵ９０１に出力する入力制御回路を含む。ユーザは、この入力装置９１５を操作することによって、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりする。

出力装置９１７は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置９１７は、例えば、ＬＣＤ、ＰＤＰ、ＯＥＬＤなどのディスプレイ、スピーカおよびヘッドホンなどの音響出力装置、ならびにプリンタ装置などでありうる。出力装置９１７は、情報処理装置９００の処理により得られた結果を、テキストまたは画像などの映像として出力したり、音響などの音として出力したりする。

ストレージ装置９１９は、情報処理装置９００の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置９１９は、例えば、ＨＤＤ（Hard Disk Drive）などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置９１９は、ＣＰＵ９０１が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。

ドライブ９２１は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２３のためのリーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９２１は、装着されているリムーバブル記録媒体９２３に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９２１は、装着されているリムーバブル記録媒体９２３に記録を書き込む。

接続ポート９２５は、機器を情報処理装置９００に直接接続するためのポートである。接続ポート９２５は、例えば、ＵＳＢ（Universal Serial Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small Computer System Interface）ポートなどでありうる。また、接続ポート９２５は、ＲＳ－２３２Ｃポート、光オーディオ端子、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）ポートなどであってもよい。接続ポート９２５に外部接続機器９２７を接続することで、情報処理装置９００と外部接続機器９２７との間で各種のデータが交換されうる。

通信装置９２９は、例えば、ネットワークＮＷに接続するための通信デバイスなどで構成された通信インタフェースである。通信装置９２９は、例えば、有線または無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Wireless USB）用の通信カードなどでありうる。また、通信装置９２９は、光通信用のルータ、ＡＤＳＬ（Asymmetric Digital Subscriber Line）用のルータ、または、各種通信用のモデムなどであってもよい。通信装置９２９は、例えば、インターネットや他の通信機器との間で、ＴＣＰ／ＩＰなどの所定のプロトコルを用いて信号などを送受信する。また、通信装置９２９に接続される通信ネットワークＮＷは、有線または無線によって接続されたネットワークであり、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信または衛星通信などである。なお、通信装置９２９は、通信部としての機能を実現する。

カメラなどの撮像装置（不図示）は、例えばＣＣＤ（Charge Coupled Device）またはＣＭＯＳ（Complementary Metal Oxide Semiconductor）などの撮像素子、および撮像素子への被写体像の結像を制御するためのレンズなどの各種の部材を用いて実空間を撮像し、撮像画像を生成する装置である。当該撮像装置は、静止画を撮像するものであってもよいし、または動画を撮像するものであってもよい。

以上、実施の形態に係るライブ配信システム１の構成と動作について説明した。この実施の形態は例示であり、各構成要素や各処理の組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本開示の範囲にあることは当業者に理解される。

実施の形態ではライブ配信プラットフォームを例として説明したが、これに限られず、ＶＯＤ（Video On Demand）などの他の動画配信プラットフォームにも本実施の形態に係る技術的思想を適用可能である。

実施の形態では、求人文章生成モデル３３２に、紹介文章生成モデルに設定した性格のうちのひとつを設定する場合を説明したが、これに限られず、例えば求人文章生成モデルは紹介文章生成モデルの性格に含まれていない性格を有してもよいし、性格を有しなくてもよい。

実施の形態において、紹介文章生成モデルは紹介文に対する補足情報を生成してもよい。補足情報の例は以下のとおりである。
「関連楽曲のリストと紹介文
XX（アーティスト名）
「ABCDE」は、カントリーポップの曲で、キャッチーなメロディに加えて、音楽理論に基づいた構成を持っています。サビの部分において、G、D、Em、Cという和音進行が採用されており、それによって聴き手に安定感と高揚感を与えています。
「HHKKLL」は、ポップな曲調に加えて、ファンクやR&Bの要素も取り入れた楽曲です。曲の構成においては、I-V-vi-IVという和音進行が多用されており、聴き手に強い印象を与える構成になっています。
「PPQQQ」は、ポップな曲調に加えて、シンセサイザーの音色やビートボックスなど、現代的な要素も取り入れた楽曲です。曲の構成においては、I-V-vi-IVという和音進行が多用されており、聴き手に心地よい印象を与える構成になっています。
以上の曲は、XXが音楽理論を活かして作り上げた楽曲の一部です。彼女の楽曲は、聴き手に心地よさと印象深さを与えるだけでなく、音楽理論的にも興味深い要素が詰まっています。」

「「CCDDE」この曲は、ギターのリフやソロにおいて、多彩なコード進行や音楽理論が取り入れられていることで有名です。
「FFG」この曲は、複雑な和声や音階を使ったギターソロが特徴的で、音楽理論の応用例としてもよく使われます。
「HKLL」この曲は、メロディアスなイントロやギターソロが特徴的で、ハーモニー理論やメロディー構成についての解説に使われることがあります。」

「初心者リスト：
「TT」
…
その他のリスト：
「ZA」」

実施の形態において、ユーザの情報としてＳＮＳなど外部のプラットフォームで公開されている情報が用いられてもよい。

実施の形態では、検索キーワードを指定して検索要求を生成する場合を説明したが、これに限られず、例えばユーザに配信者をリコメンドする場合にも本実施の形態に係る技術的思想を適用することができる。

実施の形態におけるギフトの対価ポイントから付与報酬への換算率は一例であって、これらは例えばライブ配信システムの管理者により適宜設定されてもよい。

実施の形態に係る技術的思想を、配信者の画像の代わりに配信者の動きと同期した動きをするアバターを用いるバーチャルライブ配信や、ライブコマースに適用してもよい。

本明細書において説明された処理手順、特にフロー図、フローチャートを用いて説明された処理手順においては、その処理手順を構成する工程（ステップ）の一部を省略すること、その処理手順を構成する工程として明示されていない工程を追加すること、及び／又は当該工程の順序を入れ替えることが可能であり、このような省略、追加、順序の変更がなされた処理手順も本開示の趣旨を逸脱しない限り本開示の範囲に含まれる。

サーバ１０により実現される機能の少なくとも一部は、サーバ１０以外の装置、例えばユーザ端末２０、３０により実現されてもよい。ユーザ端末２０、３０により実現される機能の少なくとも一部は、ユーザ端末２０、３０以外の装置、例えば、サーバ１０により実現されてもよい。例えば、視聴者のユーザ端末で行われる動画データの画像への所定のフレーム画像の重畳は、サーバ１０で行われてもよいし、配信者のユーザ端末で行われてもよい。

Claims

動画配信プラットフォームで配信される動画の配信者の情報を保持する配信者情報保持部と、
前記配信者により配信される動画の画像および音声を含む動画データを保持する動画データ保持部と、
前記動画データ保持部に保持される前記動画データをテキストデータに変換する変換部と、
それぞれが前記テキストデータおよび前記配信者情報保持部に保持される前記配信者の前記情報を入力とし、前記配信者を紹介する文章を出力とする複数の機械学習モデルであって、それぞれに異なる性格が設定された複数の機械学習モデルと、
前記配信者を特定するＩＤと、前記複数の機械学習モデルにより出力された前記配信者を紹介する複数の文章と、を対応付けて保持する文章保持部と、
前記動画配信プラットフォームのユーザのユーザ端末からネットワークを介して、検索要求を受け付ける要求受付部と、
前記検索要求に基づき前記文章保持部に対して検索を実行する検索部と、
前記検索部により実行された検索の結果を、前記ユーザ端末に前記ネットワークを介して提供する提供部と、を備えるサーバ。
前記検索要求に含まれる検索対象のキーワードおよび前記ユーザ端末の前記ユーザの情報を入力とし、前記ユーザの要望を表す文章を出力とする別の機械学習モデルをさらに備え、
前記検索部は、前記別の機械学習モデルにより出力された文章と前記文章保持部に保持される文章とを比較することにより検索を実行する請求項１に記載のサーバ。
前記別の機械学習モデルに、前記複数の機械学習モデルのうちのひとつの性格と同じ性格が設定される請求項２に記載のサーバ。
前記動画配信プラットフォームで配信される前記動画は前記配信者によりリアルタイムで配信される請求項１に記載のサーバ。