JP7232846B2

JP7232846B2 - ボイスチャット装置、ボイスチャット方法及びプログラム

Info

Publication number: JP7232846B2
Application number: JP2020568121A
Authority: JP
Inventors: 章悟鈴木; 拓馬大岩; 朗宮下; 哲松田; 千晶佐々木
Original assignee: Sony Interactive Entertainment Inc
Current assignee: Sony Interactive Entertainment Inc
Priority date: 2019-01-22
Filing date: 2020-01-17
Publication date: 2023-03-03
Anticipated expiration: 2040-01-17
Also published as: EP3917120A1; SG11202107956RA; WO2020153251A1; JPWO2020153251A1; CN113302682A; AU2020210375A1; EP3917120A4; US20220101849A1; CA3127299A1

Description

本発明は、ボイスチャット装置、ボイスチャット方法及びプログラムに関する。

近年、ともにゲームをプレイしているユーザやゲームのプレイ状況を表す動画像の閲覧者などといった離れた場所にいる他のユーザとボイスチャットをしながら、ユーザがゲームをプレイすることが行われるようになってきている。

ユーザによっては、ボイスチャットの内容を、ボイスチャットの音声の音声認識結果であるテキストによって把握したい者がいる。このようなユーザにはボイスチャットの音声の音声認識結果であるテキストが提供されるようにすることが望ましい。

しかし、ボイスチャットの音声の音声認識結果であるテキストを把握したいとは思っていないユーザのような、当該テキストが提供される必要のないユーザにまでも当該テキストが提供されることは通信量の無駄である。

本発明は上記実情に鑑みてなされたものであって、その目的の一つは、ボイスチャットの音声の音声認識結果であるテキストが提供されるか否かを適切に制御できるボイスチャット装置、ボイスチャット方法及びプログラムを提供することにある。

上記課題を解決するために、本発明に係るボイスチャット装置は、ボイスチャットが可能な複数のボイスチャットシステムのうちの１つに含まれるボイスチャット装置であって、ボイスチャットの音声を受け付ける音声受付部と、前記音声の音声認識結果であるテキストを取得するテキスト取得部と、通信相手である前記ボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御する送信制御部と、を含む。

本発明の一態様では、前記テキスト取得部は、前記複数の前記ボイスチャットシステムのいずれかにおいて音声認識結果が表示されるようになったことに応じて、前記テキストの取得を開始する。

この態様では、前記テキスト取得部は、前記複数の前記ボイスチャットシステムのすべてについて音声認識結果が表示されないようになったことに応じて、前記テキストの取得を停止してもよい。

また、本発明の一態様では、前記送信制御部は、通信相手である前記ボイスチャットシステムに音声認識結果を表示する補助装置が含まれているか否かに応じて、当該通信相手に前記テキストデータを送信するか否かを制御する。

この態様では、前記テキスト取得部は、前記複数の前記ボイスチャットシステムのいずれかにおいて前記補助装置が含まれるようになったことに応じて、前記テキストの取得を開始してもよい。

さらに、前記テキスト取得部は、前記複数の前記ボイスチャットシステムのすべてについて前記補助装置が含まれないようになったことに応じて、前記テキストの取得を停止してもよい。

また、本発明の一態様では、テキストを受け付けるテキスト受付部と、前記テキストの音声合成結果である音声を取得する音声取得部と、をさらに含み、前記送信制御部は、さらに、通信相手である前記ボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキスト受付部が受け付けるテキストを含むテキストデータを送信するか否かを制御する。

この態様では、前記テキスト受付部は、前記ボイスチャット装置と接続されている補助装置に入力される前記テキストを受け付けてもよい。

また、本発明の一態様では、前記テキスト取得部は、前記ボイスチャット装置と通信可能なサーバに前記音声を表す音声データを送信し、前記テキスト取得部は、前記サーバから前記音声データが表す音声の音声認識結果であるテキストを受信する。

また、本発明に係るボイスチャット方法は、ボイスチャットの音声を受け付けるステップと、前記音声の音声認識結果であるテキストを取得するステップと、通信相手であるボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御するステップと、を含む。

また、本発明に係るプログラムは、ボイスチャットの音声を受け付ける手順、前記音声の音声認識結果であるテキストを取得する手順、通信相手であるボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御する手順、をコンピュータに実行させる。

本発明の一実施形態に係るコンピュータネットワークの全体構成の一例を示す図である。本発明の一実施形態に係るボイスチャットシステムの構成の一例を示す図である。本発明の一実施形態に係るボイスチャットシステムの構成の一例を示す図である。パーティ管理データの一例を示す図である。ボイスチャットの音声が入力された際に実行される処理の一例を示す図である。パーティ管理データの一例を示す図である。ボイスチャットの音声に変換されるテキストが入力された際に実行される処理の一例を示す図である。ボイスチャットの音声が入力された際に実行される処理の一例を示す図である。補助画面の一例を示す図である。本発明の一実施形態に係るボイスチャットシステムで実装される機能の一例を示す機能ブロック図である。本発明の一実施形態に係るボイスチャット装置において行われる処理の流れの一例を示すフロー図である。本発明の一実施形態に係るボイスチャット装置において行われる処理の流れの一例を示すフロー図である。本発明の一実施形態に係るボイスチャット装置において行われる処理の流れの一例を示すフロー図である。

図１は、本発明の一実施形態に係るコンピュータネットワークの全体構成の一例を示す図である。図１に示すように、いずれもコンピュータを中心に構成された、ボイスチャットシステム１０（１０－１、１０－２、・・・、１０－ｎ）、ボイスエージェントサーバ１２、管理サーバ１４が、インターネットなどのコンピュータネットワーク１６に接続されている。ボイスチャットシステム１０、ボイスエージェントサーバ１２、管理サーバ１４は、互いに通信可能となっている。

管理サーバ１４は、例えば、ボイスチャットシステム１０を利用するユーザのアカウント情報などを管理するサーバ等のコンピュータである。管理サーバ１４は、例えば、それぞれユーザに対応付けられるアカウントデータを複数記憶する。アカウントデータには、例えば、当該ユーザの識別情報であるユーザＩＤ、当該ユーザの実名を示す実名データ、当該ユーザのメールアドレスを示すメールアドレスデータ、などが含まれる。

ボイスエージェントサーバ１２は、本実施形態では例えば、受け付ける音声に対する音声認識処理の実行結果を示すテキストの生成、及び、受け付けるテキストに対する音声合成処理の実行結果を示す音声の生成を実行するサーバ等のサーバコンピュータである。ボイスエージェントサーバ１２には、受け付ける音声に対する音声認識処理の実行結果を示すテキストを生成する音声認識エンジン、及び、受け付けるテキストに対する音声合成処理の実行結果を示す音声を生成する音声合成エンジンが実装されていてもよい。

図２Ａに示すように、ボイスチャットシステム１０には、ボイスチャット装置２０とルータ２２とが含まれている。

ボイスチャット装置２０は、例えば、ゲームコンソール、携帯型ゲーム装置、スマートフォン、パーソナルコンピュータなどといった、ボイスチャットの音声の入出力が可能なコンピュータである。

図２Ａに示すように、ボイスチャット装置２０には、例えば、プロセッサ２０ａ、記憶部２０ｂ、通信部２０ｃ、表示部２０ｄ、操作部２０ｅ、マイク２０ｆ、スピーカ２０ｇ、エンコード・デコード部２０ｈが含まれている。なお、ボイスチャット装置２０がカメラを備えていてもよい。

プロセッサ２０ａは、例えばＣＰＵ等のプログラム制御デバイスであって、記憶部２０ｂに記憶されたプログラムに従って各種の情報処理を実行する。

記憶部２０ｂは、例えばＲＯＭやＲＡＭ等の記憶素子やハードディスクドライブなどである。

通信部２０ｃは、例えばルータ２２、及び、コンピュータネットワーク１６を介して、他のボイスチャットシステム１０、ボイスエージェントサーバ１２、管理サーバ１４などといったコンピュータとの間でデータを授受するための通信インタフェースである。

表示部２０ｄは、例えば液晶ディスプレイ等であり、プロセッサ２０ａが生成する画面や、通信部２０ｃを介して受信する動画像データが表す動画像などを表示させる。

操作部２０ｅは、例えばプロセッサ２０ａに対する操作入力を行うための操作部材である。なお操作部２０ｅがゲームコントローラであってもよい。

マイク２０ｆは、例えばボイスチャットの音声の入力に用いられる音声入力デバイスである。

スピーカ２０ｇは、例えばボイスチャットの音声の出力に用いられる音声出力デバイスである。

エンコード・デコード部２０ｈは、例えばエンコーダとデコーダとを含む。エンコード・デコード部２０ｈは、入力される音声をエンコードすることにより当該音声を表す音声データを生成する。また、エンコード・デコード部２０ｈは、入力される音声データをデコードして、当該音声データが表す音声を出力する。

また所定のペアリング処理を実行することで、図２Ｂに示すように、本実施形態に係るボイスチャットシステム１０には、ボイスチャット装置２０に加えてさらに、ボイスチャットを支援する補助装置２４を追加できるようになっている。

補助装置２４は、例えば、スマートフォンやタブレット端末などの携帯型のコンピュータである。なお補助装置２４は、据置型のコンピュータであっても構わない。

本実施形態に係る補助装置２４には、例えば、プロセッサ２４ａ、記憶部２４ｂ、通信部２４ｃ、タッチパネル２４ｄ、が含まれている。

プロセッサ２４ａは、例えばＣＰＵ等のプログラム制御デバイスであって、記憶部２４ｂに記憶されたプログラムに従って各種の情報処理を実行する。

記憶部２４ｂは、例えばＲＯＭやＲＡＭ等の記憶素子やハードディスクドライブなどである。

通信部２４ｃは、例えばルータ２２を介して、ボイスチャット装置２０等のコンピュータとの間でデータを授受するための通信インタフェースである。なお通信部２４ｃが、例えばルータ２２、及び、コンピュータネットワーク１６を介して、他のボイスチャットシステム１０、ボイスエージェントサーバ１２、管理サーバ１４等のコンピュータとの間で情報の送受信が行えてもよい。

タッチパネル２４ｄは、例えばタッチセンサと液晶ディスプレイ等のディスプレイとが一体となったものである。タッチパネル２４ｄは、プロセッサ２４ａが生成する画面などを表示させる。またユーザは、タッチパネル２４ｄに対してタップ等の各種操作を行うことで、プロセッサ２４ａに対する操作入力を行えるようになっている。

ボイスチャット装置２０及び補助装置２４は有線又は無線で、コンピュータネットワーク１６に接続されたルータ２２と接続されている。そしてボイスチャット装置２０及び補助装置２４は、ルータ２２を介して、他のボイスチャットシステム１０、ボイスエージェントサーバ１２、管理サーバ１４と通信を行う。

本実施形態では、複数のボイスチャットシステム１０（１０－１～１０－ｎ）は、ボイスチャットが可能になっている。そのため本実施形態では、それぞれ互いに異なるボイスチャットシステム１０を利用する複数のユーザがボイスチャットを楽しめるようになっている。ここで例えば、ボイスチャットに参加している一部又は全部のユーザがプレイ中であるゲームのプレイ状況を表す動画像を共有しながらボイスチャットが行われるようにしてもよい。

本実施形態では、ボイスチャットに参加している複数のユーザは、パーティと呼ばれるグループに属することとする。また、本実施形態に係るボイスチャットシステム１０のユーザは、所定の操作を行うことで、新規のパーティの作成や、既に作成されているパーティへの参加を行うことができる。

また本実施形態では、補助装置２４とボイスチャット装置２０とのペアリング処理が実行済であるボイスチャットシステム１０のユーザは、所定の操作を行うことで、当該ボイスチャットシステム１０におけるボイスチャット支援サービスを利用できるようになる。

ボイスチャット支援サービスが利用可能なボイスチャットシステム１０では、ボイスチャットの音声の音声認識結果を補助装置２４のタッチパネル２４ｄに表示させることや、音声の代わりにテキストによってボイスチャットの入力を行うことが可能となる。またボイスチャット支援サービスを利用しているユーザは所定の操作を行うことで、当該ボイスチャット支援サービスの利用を停止することができる。

本実施形態では、パーティに関する情報が、図３に例示するパーティ管理データによって管理されている。パーティ管理データは、例えば、管理サーバ１４に記憶される。図３に示すように、パーティ管理データには、パーティの識別情報であるパーティＩＤと、それぞれ当該パーティに参加しているユーザに対応付けられるユーザデータと、が含まれる。そして、ユーザデータには、ユーザＩＤ、接続先アドレスデータ、種類データ、支援サービス利用フラグ、などが含まれている。

ユーザＩＤは、例えば当該ユーザの識別情報である。接続先アドレスデータは、例えば当該ユーザが利用するボイスチャット装置２０のアドレスを示すデータである。種類データは、例えば当該ユーザが利用するボイスチャット装置２０の種類を示すデータである。支援サービス利用フラグは、例えば当該ユーザが利用するボイスチャットシステム１０においてボイスチャット支援サービスが利用可能であるか否かを示すフラグである。ここでは例えば、当該ボイスチャットシステム１０においてボイスチャット支援サービスが利用可能である場合は、支援サービス利用フラグの値として１が設定されることとする。また例えば、当該ボイスチャットシステム１０においてボイスチャット支援サービスが利用可能ではない場合は、支援サービス利用フラグの値として０が設定されることとする。

図３には、５人のユーザが参加するパーティに対応付けられる、パーティＩＤが００１であるパーティ管理データが例示されている。図３に示すパーティ管理データには、それぞれ当該パーティに参加するユーザに対応付けられる５個のユーザデータが含まれている。以下、ユーザＩＤがａａａであるユーザ、ｂｂｂであるユーザ、ｃｃｃであるユーザ、ｄｄｄであるユーザ、ｅｅｅであるユーザを、それぞれ、ユーザＡ、ユーザＢ、ユーザＣ、ユーザＤ、ユーザＥと呼ぶこととする。また、ユーザＡ、ユーザＢ、ユーザＣ、ユーザＤ、ユーザＥは、それぞれ、ボイスチャットシステム１０－１、１０－２、１０－３、１０－４、１０－５を利用していることとする。また、ボイスチャットシステム１０－１、１０－２、１０－３、１０－４、１０－５には、それぞれ、ボイスチャット装置２０－１、２０－２、２０－３、２０－４、２０－５が含まれていることとする。

図３に例示するパーティ管理データには、いずれのボイスチャットシステム１０についても、ボイスチャット支援サービスが利用可能でないことが示されている。

また本実施形態では、管理サーバ１４に記憶されているパーティ管理データのコピーが、当該パーティ管理データに対応付けられるパーティに参加するユーザが利用するボイスチャット装置２０に送信される。そしてボイスチャット装置２０の記憶部２０ｂには、管理サーバ１４に記憶されているパーティ管理データのコピーが記憶される。そのため、パーティに参加するユーザが利用するボイスチャット装置２０は、当該パーティに参加するユーザが利用するボイスチャット装置２０のアドレスを特定可能である。

また本実施形態では、例えばユーザによるパーティへの参加操作、ボイスチャット支援サービスの利用を開始する操作、ボイスチャット支援サービスの利用を停止する操作、などに応じて、管理サーバ１４に記憶されているパーティ管理データは更新される。そして管理サーバ１４に記憶されているパーティ管理データが更新される度に、更新後のパーティ管理データのコピーが、当該パーティ管理データに対応付けられるパーティに参加するユーザが利用するボイスチャット装置２０に送信される。そして、ボイスチャット装置２０の記憶部２０ｂに記憶されているパーティ管理データのコピーは更新される。このようにして本実施形態では、パーティ管理データに示されている最新の情報が、当該パーティ管理データに対応付けられるパーティに参加するユーザが利用するボイスチャット装置２０で共有されることとなる。

以下の説明では、図３のパーティ管理データに示されている５人のユーザによるボイスチャットが行われることとする。

図４は、パーティ管理データが図３に示す状況である場合に、ユーザＡによりボイスチャットの音声が入力された際に実行される処理の一例を示す図である。この場合は、ボイスチャットシステム１０－１～１０－５のそれぞれについて、当該ボイスチャットシステム１０に含まれるボイスチャット装置２０においてパーティプロセス３０が実行される。

ユーザＡによってボイスチャット装置２０－１のマイク２０ｆを介して音声が入力されると、当該音声を表す音声データが、ボイスチャット装置２０－１のパーティプロセス３０に入力される（図４（１）参照）。そして、当該パーティプロセス３０は、入力された音声データを、ユーザＡと同じパーティに参加している他のユーザが利用するボイスチャット装置２０のパーティプロセス３０に送信する（図４（２）参照）。ここで例えば、ユーザＡのユーザＩＤが関連付けられた音声データが送信されてもよい。図４には、音声データの送信先の一例としてボイスチャット装置２０－２が示されているが、ボイスチャット装置２０－３～２０－５についても同様の音声データが送信される。そして当該音声データを受信したパーティプロセス３０は、当該音声データが表す音声をスピーカ２０ｇから出力させる（図４（３）参照）。

ユーザＢ～ユーザＥについても同様に、当該ユーザによって入力された音声は、当該ユーザと同じパーティに参加している他のユーザが利用するボイスチャット装置２０から出力される。

図５は、パーティ管理データの別の一例を示す図である。図５に例示するパーティ管理データには、ボイスチャットシステム１０－１、１０－２については、ボイスチャット支援サービスが利用可能であることが示されている。また、ボイスチャットシステム１０－３～１０－５については、ボイスチャット支援サービスが利用可能でないことが示されている。

なお以下の説明では、ボイスチャットシステム１０－１に、ボイスチャット装置２０－１及び補助装置２４－１が含まれていることとする。また、ボイスチャットシステム１０－２に、ボイスチャット装置２０－２及び補助装置２４－２が含まれていることとする。

本実施形態では例えば、ユーザＡが所定の操作を行って、ボイスチャットシステム１０－１におけるボイスチャット支援サービスを利用できるようになると、管理サーバ１４に記憶されているパーティ管理データは更新される。ここでは例えば、ユーザＩＤがａａａであるユーザデータの支援サービス利用フラグの値が０から１に更新される。すると、このことに応じて、ボイスチャット装置２０－１～２０－５に記憶されているパーティ管理データが同様に更新される。

また同様に、ユーザＢが所定の操作を行って、ボイスチャットシステム１０－２におけるボイスチャット支援サービスを利用できるようになると、管理サーバ１４、及び、ボイスチャット装置２０－１～２０－５に記憶されているパーティ管理データが更新される。ここでは例えば、ユーザＩＤがｂｂｂであるユーザデータの支援サービス利用フラグの値が０から１に更新される。

図６は、パーティ管理データが図５に示す状況である場合に、ユーザＡによりボイスチャットの音声に変換されるテキストが入力された際に実行される処理の一例を示す図である。この例でも、ボイスチャットシステム１０－１～１０－５のそれぞれについて、当該ボイスチャットシステム１０に含まれるボイスチャット装置２０においてパーティプロセス３０が実行される。

またこの例では、ボイスチャット支援サービスが利用可能なボイスチャットシステム１０の補助装置２４においてコンパニオンアプリケーションプロセス３２が実行される。そして、当該ボイスチャットシステム１０のボイスチャット装置２０では、コンパニオンアプリケーションプロセス３２と通信するプロキシプロセス３４が実行される。ここでは例えば、補助装置２４－１及び２４－２において、コンパニオンアプリケーションプロセス３２が実行される。そして、ボイスチャット装置２０－１において、補助装置２４－１のコンパニオンアプリケーションプロセス３２と通信するプロキシプロセス３４が実行される。また、ボイスチャット装置２０－２において、補助装置２４－２のコンパニオンアプリケーションプロセス３２と通信するプロキシプロセス３４が実行される。

また本実施形態では、図５に示すように、パーティに参加するユーザが利用するボイスチャットシステム１０の少なくとも１つにおいてボイスチャット支援サービスが利用可能である。この場合は、当該パーティに参加するユーザが利用するボイスチャット装置２０のすべてにおいてボイスエージェントプロセス３６が実行される。

例えばボイスチャット装置２０に記憶されているパーティ管理データに含まれるいずれかのユーザデータに含まれる支援サービス利用フラグの値が１に更新されることに応じて、当該ボイスチャット装置２０はボイスエージェントプロセス３６を起動する。

ここでは例えば、ボイスチャット装置２０－１～２０－５において、ボイスエージェントプロセス３６が実行される。なお本実施形態では、ボイスチャットシステム１０－３～１０－５ではボイスチャット支援サービスが利用可能ではないが、ボイスチャット装置２０－３～２０－５では、ボイスエージェントプロセス３６が実行されることとなる。

ここで例えばユーザＡによって補助装置２４－１のタッチパネル２４ｄにテキストが入力されたとする（図６（１）参照）。すると、補助装置２４－１のコンパニオンアプリケーションプロセス３２がボイスチャット装置２０－１のプロキシプロセス３４に当該テキストを含むテキストデータを送信する（図６（２）参照）。すると、ボイスチャット装置２０－１において、プロキシプロセス３４がボイスエージェントプロセス３６及びパーティプロセス３０に当該テキストデータを出力する（図６（３）（４）参照）。

そして、ボイスチャット装置２０－１のボイスエージェントプロセス３６が、ボイスエージェントサーバ１２に当該テキストデータを送信する（図６（５）参照）。すると、ボイスエージェントサーバ１２が、当該テキストデータに対して音声合成処理を実行し、その実行結果である音声データをボイスチャット装置２０－１のボイスエージェントプロセス３６に送信する（図６（６）参照）。そしてボイスエージェントプロセス３６は、パーティプロセス３０に当該音声データを出力する（図６（７）参照）。

そしてボイスチャット装置２０－１のパーティプロセス３０は、ボイスチャット支援サービスが利用可能である他のボイスチャットシステム１０を特定する。ここでは例えばボイスチャットシステム１０－２が特定される。そしてボイスチャット装置２０－１のパーティプロセス３０は、特定されたボイスチャットシステム１０に含まれるボイスチャット装置２０のパーティプロセス３０に、上述の音声データ及び上述のテキストデータを送信する（図６（８）参照）。ここで例えば、ユーザＡのユーザＩＤが関連付けられた音声データ及びテキストデータが送信されてもよい。

すると、ボイスチャット装置２０－２のパーティプロセス３０は、受信したテキストデータをプロキシプロセス３４に出力する（図６（９）参照）。そして、ボイスチャット装置２０－２のプロキシプロセス３４は当該テキストデータを、補助装置２４－２のコンパニオンアプリケーションプロセス３２に送信する（図６（１０）参照）。すると、補助装置２４－２のコンパニオンアプリケーションプロセス３２は、当該テキストデータに含まれるテキストをタッチパネル２４ｄに表示させる（図６（１１）参照）。また、ボイスチャット装置２０－２のパーティプロセス３０は、受信した音声データが表す音声をスピーカ２０ｇから出力させてもよい（図６（１２）参照）。

また、ボイスチャット装置２０－１のパーティプロセス３０は、ボイスチャット支援サービスが利用可能でない他のボイスチャットシステム１０を特定する。ここでは例えば、ボイスチャットシステム１０－３～１０－５が特定される。そしてボイスチャット装置２０－１のパーティプロセス３０は、特定されたボイスチャットシステム１０に含まれるボイスチャット装置２０のパーティプロセス３０に、上述の音声データのみを送信する（図６（１３）参照）。ここで例えば、ユーザＡのユーザＩＤが関連付けられた音声データが送信されてもよい。ボイスチャット支援サービスが利用可能でないボイスチャットシステム１０のパーティプロセス３０には、上述のテキストデータは送信されない。図６には、ボイスチャット装置２０－３のパーティプロセス３０に音声データが送信されることが代表して示されている。すると、ボイスチャット装置２０－３のパーティプロセス３０は、受信した音声データが表す音声をスピーカ２０ｇから出力させる（図６（１４）参照）。なお本実施形態では同様にして、ボイスチャット装置２０－４、２０－５のスピーカ２０ｇから上述の音声データが表す音声が出力される。

図７は、パーティ管理データが図５に示す状況である場合に、ユーザＣによりボイスチャットの音声が入力された際に実行される処理の一例を示す図である。

ユーザＣによってボイスチャット装置２０－３のマイク２０ｆを介して音声が入力されると、当該音声を表す音声データが、ボイスチャット装置２０－３のパーティプロセス３０、及び、ボイスエージェントプロセス３６に入力される（図７（１）参照）。

そして、ボイスチャット装置２０－３のボイスエージェントプロセス３６が、ボイスエージェントサーバ１２に当該音声データを送信する（図７（２）参照）。すると、ボイスエージェントサーバ１２が、当該音声データに対して音声認識処理を実行し、その実行結果であるテキストデータを当該ボイスエージェントプロセス３６に送信する（図７（３）参照）。そしてボイスエージェントプロセス３６は、パーティプロセス３０に当該テキストデータを出力する（図７（４）参照）。

そしてボイスチャット装置２０－３のパーティプロセス３０は、ボイスチャット支援サービスが利用可能である他のボイスチャットシステム１０を特定する。ここでは例えば、ボイスチャットシステム１０－１、１０－２が特定される。そしてボイスチャット装置２０－３のパーティプロセス３０は、特定されたボイスチャットシステム１０に含まれるボイスチャット装置２０のパーティプロセス３０に、上述の音声データ及び上述のテキストデータを送信する（図７（５）参照）。ここで例えば、ユーザＣのユーザＩＤが関連付けられた音声データ及びテキストデータが送信されてもよい。図７には、ボイスチャット装置２０－１のパーティプロセス３０に音声データ及びテキストデータが送信されることが代表して示されている。

すると、ボイスチャット装置２０－１のパーティプロセス３０は、受信したテキストデータをプロキシプロセス３４に出力する（図７（６）参照）。そして、ボイスチャット装置２０－１のプロキシプロセス３４は、当該テキストデータを、補助装置２４－１のコンパニオンアプリケーションプロセス３２に送信する（図７（７）参照）。すると、補助装置２４－１のコンパニオンアプリケーションプロセス３２は、当該テキストデータに含まれるテキストをタッチパネル２４ｄに表示させる（図７（８）参照）。また、ボイスチャット装置２０－１のパーティプロセス３０は、受信した音声データが表す音声をスピーカ２０ｇから出力させてもよい（図７（９）参照）。なお本実施形態では同様にして、補助装置２４－２についても当該テキストデータに含まれるテキストがタッチパネル２４ｄに表示される。ここで上述の音声データが表す音声がボイスチャット装置２０－２のスピーカ２０ｇから出力されてもよい。

また、ボイスチャット装置２０－３のパーティプロセス３０は、ボイスチャット支援サービスが利用可能でない他のボイスチャットシステム１０を特定する。ここでは例えば、ボイスチャットシステム１０－４、１０－５が特定される。そしてボイスチャット装置２０－３のパーティプロセス３０は、特定されたボイスチャットシステム１０に含まれるボイスチャット装置２０のパーティプロセス３０に、上述の音声データのみを送信する（図７（１０）参照）。ここで例えば、ユーザＣのユーザＩＤが関連付けられた音声データが送信されてもよい。ボイスチャット支援サービスが利用可能でないボイスチャットシステム１０のパーティプロセス３０には、上述のテキストデータは送信されない。図７には、ボイスチャット装置２０－４のパーティプロセス３０に音声データが送信されることが代表して示されている。すると、ボイスチャット装置２０－４のパーティプロセス３０は、受信した音声データが表す音声をスピーカ２０ｇから出力させる（図７（１１）参照）。なお本実施形態では同様にして、ボイスチャット装置２０－５のスピーカ２０ｇから上述の音声データが表す音声が出力される。

図８は、本実施形態に係る補助装置２４のタッチパネル２４ｄに表示される補助画面の一例を示す図である。図８には、ボイスチャット支援サービスが利用可能な状態におけるユーザＡが利用する補助装置２４－１のタッチパネル２４ｄに表示される補助画面が示されている。

図８に示す補助画面には、ユーザＡとは異なるユーザにより入力された音声の音声認識結果であるテキストが配置される。例えば、図８に示す補助画面には、ユーザＢにより入力された音声の音声認識結果であるテキストＳ１が、ユーザＢのユーザＩＤを表す文字列Ｓ２に対応付けられた状態で配置されている。ユーザＢのユーザＩＤは、例えば、ボイスチャット装置２０－２から送信される、ユーザＢのユーザＩＤに関連付けられた音声データ及びテキストデータに基づいて特定可能である。

また、図８に示す補助画面には、ユーザＣにより入力された音声の音声認識結果であるテキストＳ３が、ユーザＣのユーザＩＤを表す文字列Ｓ４に対応付けられた状態で配置されている。ユーザＣのユーザＩＤは、例えば、ボイスチャット装置２０－３から送信される、ユーザＣのユーザＩＤに関連付けられた音声データ及びテキストデータに基づいて特定可能である。

また補助画面には、テキストを入力するためのフォームＦ、及び、フォームＦに入力されたテキストを投稿するための送信ボタンＳＢが配置されている。例えばユーザＡがフォームＦにテキストを入力して送信ボタンＳＢをタップすると、当該テキストを含むテキストデータがボイスチャット装置２０－１に送信される。また補助画面には、このようにしてユーザＡにより入力されたテキストＳ５が、ユーザＡのユーザＩＤを表す文字列Ｓ６に対応付けられた状態で配置される。

本実施形態において、パーティに参加するユーザが利用するボイスチャットシステム１０のすべてにおいてボイスチャット支援サービスが利用可能でない状態になったとする。この場合は、当該パーティに参加するユーザが利用するボイスチャット装置２０のすべてにおいてボイスエージェントプロセス３６が終了される。

例えばボイスチャット装置２０に記憶されているパーティ管理データに含まれるすべてのユーザデータについて、支援サービス利用フラグの値が０に設定されたことに応じて、当該ボイスチャット装置２０はボイスエージェントプロセス３６を終了する。

以上のように本実施形態では、ボイスチャット支援サービスが利用可能でないボイスチャットシステム１０には、ボイスチャットの音声の音声認識結果であるテキストは提供されない。そのため本実施形態によれば、すべてのボイスチャットシステム１０にボイスチャットの音声の音声認識結果であるテキストが提供される場合よりも、ボイスチャットにおける通信量が低減される。このようにして本実施形態によれば、ボイスチャットの音声の音声認識結果であるテキストが提供されるか否かを適切に制御できることとなる。

以下、本実施形態に係るボイスチャットシステム１０で実装される機能について、さらに説明する。

図９は、本実施形態に係るボイスチャットシステム１０で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係るボイスチャットシステム１０で、図９に示す機能のすべてが実装される必要はなく、また、図９に示す機能以外の機能が実装されていても構わない。

図９に示すように、本実施形態に係るボイスチャット装置２０には、機能的には例えば、パーティ管理データ記憶部４０、パーティ管理部４２、音声受付部４４、テキスト取得部４６、テキスト受付部４８、音声取得部５０、送信制御部５２、データ受信部５４、音声出力部５６、補助送信部５８、が含まれる。

パーティ管理データ記憶部４０は、記憶部２０ｂを主として実装される。パーティ管理部４２、送信制御部５２は、プロセッサ２０ａ及び通信部２０ｃを主として実装される。音声受付部４４は、マイク２０ｆ及びエンコード・デコード部２０ｈを主として実装される。テキスト取得部４６、テキスト受付部４８、音声取得部５０、データ受信部５４、補助送信部５８は、通信部２０ｃを主として実装される。音声出力部５６は、スピーカ２０ｇ及びエンコード・デコード部２０ｈを主として実装される。

そして以上の機能は、コンピュータであるボイスチャット装置２０にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ２０ａで実行することにより実装されている。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介してボイスチャット装置２０に供給される。

また、図９に示すように、本実施形態に係る補助装置２４には、機能的には例えば、テキスト受付部６０、テキスト送信部６２、補助受信部６４、表示制御部６６、が含まれる。テキスト受付部６０、表示制御部６６は、プロセッサ２４ａ及びタッチパネル２４ｄを主として実装される。テキスト送信部６２、補助受信部６４は、通信部２４ｃを主として実装される。

そして以上の機能は、コンピュータである補助装置２４にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ２４ａで実行することにより実装されている。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して補助装置２４に供給される。

パーティ管理データ記憶部４０は、本実施形態では例えば、図３及び図５に例示するパーティ管理データを記憶する。

パーティ管理部４２は、本実施形態では例えば、管理サーバ１４から送信されるパーティ管理データの受信に応じて、パーティ管理データ記憶部４０に記憶されているパーティ管理データを、受信したパーティ管理データに更新する。

本実施形態では例えば、ユーザによる、ボイスチャット支援サービスの利用を開始する操作、又は、利用を停止する操作に応じて、管理サーバ１４に記憶されているパーティ管理データにおける、支援サービス利用フラグの値が更新される。そして、当該更新に応じて、管理サーバ１４は、当該パーティ管理データにより管理されているパーティの参加者が利用するボイスチャットシステム１０に更新後のパーティ管理データを送信する。そして上述のように、パーティ管理部４２は、管理サーバ１４から送信されるパーティ管理データの受信に応じて、パーティ管理データ記憶部４０に記憶されているパーティ管理データを、受信したパーティ管理データに更新する。

また、パーティ管理部４２は、更新後のパーティ管理データに基づいて、いずれかのボイスチャットシステム１０において音声認識結果が表示されるようになったことを検出してもよい。当該検出の一例としては、すべての支援サービス利用フラグの値が０である状態から、少なくとも１つの支援サービス利用フラグの値が１である状態に変化したことの検出が挙げられる。

また、パーティ管理部４２は、更新後のパーティ管理データに基づいて、すべてのボイスチャットシステム１０について音声認識結果が表示されないようになったことを検出してもよい。当該検出の一例としては、少なくとも１つの支援サービス利用フラグの値が１である状態から、すべての支援サービス利用フラグの値が０である状態に変化したことの検出が挙げられる。

音声受付部４４は、本実施形態では例えば、ボイスチャットの音声を受け付ける。音声受付部４４は、当該音声をエンコードすることにより、当該音声を表す音声データを生成してもよい。

テキスト取得部４６は、本実施形態では例えば、音声受付部４４が受け付ける音声の音声認識結果であるテキストを取得する。ここで例えば、テキスト取得部４６は、ボイスチャット装置２０と通信可能なボイスエージェントサーバ１２に当該音声を表す音声データを送信してもよい。そしてテキスト取得部４６は、ボイスエージェントサーバ１２から、当該音声データが表す音声の音声認識結果であるテキストを含むテキストデータを受信してもよい。当該機能は、図６、及び、図７に示すボイスエージェントプロセス３６の機能に相当する。

また、テキスト取得部４６は、少なくとも１つのボイスチャットシステム１０のいずれかにおいて音声認識結果が表示されるようになったことに応じて、テキストの取得を開始してもよい。また、テキスト取得部４６は、少なくとも１つのボイスチャットシステム１０のいずれかにおいて補助装置２４が含まれるようになったことに応じて、テキストの取得を開始してもよい。例えば、パーティ管理部４２によりいずれかのボイスチャットシステム１０においてテキストが表示されるようになったことが検出されたことに応じて、テキスト取得部４６は、ボイスエージェントプロセス３６を起動してもよい。

また、テキスト取得部４６は、少なくとも１つのボイスチャットシステム１０のすべてについて音声認識結果が表示されないようになったことに応じて、テキストの取得を停止してもよい。また、テキスト取得部４６は、少なくとも１つのボイスチャットシステム１０のすべてについて補助装置２４が含まれないようになったことに応じて、テキストの取得を停止してもよい。例えば、パーティ管理部４２によりすべてのボイスチャットシステム１０についてテキストが表示されないようになったことを検出されたことに応じて、テキスト取得部４６は、ボイスエージェントプロセス３６を終了させてもよい。

ボイスチャット装置２０のテキスト受付部４８は、本実施形態では例えば、音声合成処理の対象となるテキストを受け付ける。ここでテキスト受付部４８は、例えば、ボイスチャット装置２０と接続されている補助装置２４に入力されるテキストを受け付けてもよい。当該機能は、図６、及び、図７に示すプロキシプロセス３４の機能に相当する。

音声取得部５０は、本実施形態では例えば、テキスト受付部４８が受け付けるテキストの音声合成結果である音声を取得する。ここで例えば、音声取得部５０は、ボイスチャット装置２０と通信可能なボイスエージェントサーバ１２に当該テキストを含むテキストデータを送信してもよい。そして音声取得部５０は、ボイスエージェントサーバ１２から、当該テキストデータに含まれるテキストの音声合成結果である音声を受信してもよい。当該機能は、図６、及び、図７に示すボイスエージェントプロセス３６の機能に相当する。

送信制御部５２は、本実施形態では例えば、通信相手であるボイスチャットシステム１０において音声認識結果が表示されるか否かに応じて、当該通信相手にテキストデータを送信するか否かを制御する。ここで送信制御部５２は、通信相手であるボイスチャットシステム１０において音声認識結果が表示されるか否かに応じて、当該通信相手に音声データを送信するか、当該音声データとともにテキストデータを送信するか否かを制御してもよい。例えば、送信制御部５２は、音声受付部４４が受け付ける音声を表す音声データを送信するか、当該音声データとともにテキスト取得部４６が取得するテキストデータを送信するかを制御してもよい。また例えば、送信制御部５２は、音声取得部５０が取得する音声を表す音声データを送信するか、当該音声データとともにテキスト受付部４８が受け付けるテキストを含むテキストデータを送信するかを制御してもよい。当該機能は、図５～図７に示すパーティプロセス３０の機能に相当する。

ここで送信制御部５２は、例えば、通信相手であるボイスチャットシステム１０に音声認識結果を表示する補助装置２４が含まれているか否かに応じて、当該通信相手にテキストデータを送信するか否かを制御してもよい。また、送信制御部５２は、例えば、通信相手であるボイスチャットシステム１０に音声認識結果を表示する補助装置２４が含まれているか否かに応じて、音声データを送信するか、音声データとともにテキストデータを送信するかを制御してもよい。

また例えば、パーティ管理データ記憶部４０に記憶されているパーティ管理データの支援サービス利用フラグの値に基づいて、通信相手にテキストデータを送信するか否かが制御されてもよい。例えば、支援サービス利用フラグの値が１であるボイスチャットシステム１０には音声データとテキストデータが送信されるようにしてもよい。そして支援サービス利用フラグの値が０であるボイスチャットシステム１０には音声データのみが送信されるようにしてもよい。

データ受信部５４は、本実施形態では例えば、通信相手のボイスチャット装置２０から送信される音声データを受信する。また、データ受信部５４は、本実施形態では例えば、通信相手のボイスチャット装置２０から送信されるテキストデータを受信する。当該機能は、図５～図７に示すパーティプロセス３０の機能に相当する。

音声出力部５６は、本実施形態では例えば、ボイスチャットの音声を出力する。例えば、音声出力部５６は、データ受信部５４が受信する音声データが表す音声を出力する。音声出力部５６は、データ受信部５４が受信する音声データをデコードして、当該音声データが表す音声を出力してもよい。

補助送信部５８は、本実施形態では例えば、データ受信部５４が受信するテキストデータを補助装置２４に送信する。当該機能は、図６、図７に示すプロキシプロセス３４の機能に相当する。

補助装置２４のテキスト受付部６０は、本実施形態では例えば、タッチパネル２４ｄに入力されるテキストを受け付ける。

テキスト送信部６２は、本実施形態では例えば、テキスト受付部６０が受け付けるテキストを含むテキストデータをボイスチャット装置２０に送信する。

補助受信部６４は、本実施形態では例えば、ボイスチャット装置２０から送信されるテキストデータを受信する。

表示制御部６６は、本実施形態では例えば、補助受信部６４が受信するテキストデータに含まれるテキストや、テキスト受付部６０が受け付けるテキストを、例えばタッチパネル２４ｄに表示させる。表示制御部６６は、図８に示す補助画面をタッチパネル２４ｄに表示させてもよい。

補助装置２４のテキスト受付部６０、テキスト送信部６２、補助受信部６４、及び、表示制御部６６の機能は、図６、図７に示すコンパニオンアプリケーションプロセス３２の機能に相当する。

ここで、ボイスエージェントプロセス３６が停止している状態における、本実施形態に係るボイスチャット装置２０において行われる処理の流れの一例を、図１０に例示するフロー図を参照しながら説明する。図１０に示すＳ１０１～Ｓ１０２に示す処理は、所定のサンプリングレートで繰り返し実行される。

まず、音声受付部４４が、本ループの期間において受け付けた音声をエンコードすることにより、音声データを生成する（Ｓ１０１）。

そして、送信制御部５２が、Ｓ１０１に示す処理で生成された音声データを、同じパーティに参加しているユーザが利用しているボイスチャット装置２０に送信して（Ｓ１０２）、Ｓ１０１に示す処理に戻る。なお、Ｓ１０２に示す処理を実行するボイスチャット装置２０自身に対しては、音声データは送信されない。

Ｓ１０２に示す処理で送信された音声データを受信したボイスチャット装置２０では、当該音声データが表す音声が出力される。

次に、ボイスエージェントプロセス３６が動作している状態において行われる音声入力に応じた、本実施形態に係るボイスチャット装置２０において行われる処理の流れの一例を、図１１に例示するフロー図を参照しながら説明する。図１１に示すＳ２０１～Ｓ２０７に示す処理は、所定のサンプリングレートで繰り返し実行される。

まず、音声受付部４４が、本ループの期間において受け付けた音声をエンコードすることにより、音声データを生成する（Ｓ２０１）。

そして、テキスト取得部４６が、Ｓ２０１に示す処理で生成された音声データを、ボイスエージェントサーバ１２に送信する（Ｓ２０２）。

そして、テキスト取得部４６が、ボイスエージェントサーバ１２から送信されるテキストデータを受信する（Ｓ２０３）。

そして、送信制御部５２が、パーティ管理データ記憶部４０に記憶されているパーティ管理データに基づいて、支援サービス利用フラグの値が１であるユーザデータに対応付けられるボイスチャット装置２０を特定する（Ｓ２０４）。

そして、送信制御部５２が、Ｓ２０４に示す処理により特定されたボイスチャット装置２０に、Ｓ２０１に示す処理で生成された音声データ、及び、Ｓ２０３に示す処理で受信したテキストデータを送信する（Ｓ２０５）。なお、Ｓ２０５に示す処理を実行するボイスチャット装置２０自身に対しては、音声データ及びテキストデータは送信されない。

そして、送信制御部５２が、パーティ管理データ記憶部４０に記憶されているパーティ管理データに基づいて、支援サービス利用フラグの値が０であるユーザデータに対応付けられるボイスチャット装置２０を特定する（Ｓ２０６）。

そして、送信制御部５２が、Ｓ２０６に示す処理により特定されたボイスチャット装置２０に、Ｓ２０１に示す処理で生成された音声データを送信して（Ｓ２０７）、Ｓ２０１に示す処理に戻る。なお、Ｓ２０７に示す処理を実行するボイスチャット装置２０自身に対しては、音声データは送信されない。

Ｓ２０５、及び、Ｓ２０７に示す処理で送信された音声データを受信したボイスチャット装置２０では、当該音声データが表す音声が出力される。

Ｓ２０５に示す処理で送信されたテキストデータを受信したボイスチャット装置２０は、当該ボイスチャット装置２０に接続されている補助装置２４に当該テキストデータを送信する。そして当該テキストデータを受信した補助装置２４は、当該補助装置２４のタッチパネル２４ｄに当該テキストデータに含まれるテキストを表示させる。

なお、Ｓ２０５に示す処理において、Ｓ２０３に示す処理で受信したテキストデータのみが送信されるようにしてもよい。そしてこの場合、当該テキストデータを受信したボイスチャット装置２０からはＳ２０１に示す処理で生成された音声データが表す音声が出力されなくてもよい。

次に、ボイスエージェントプロセス３６が動作している状態において行われるテキスト入力に応じた、本実施形態に係るボイスチャット装置２０において行われる処理の流れの一例を、図１２に例示するフロー図を参照しながら説明する。図１２に示すＳ３０１～Ｓ３０７に示す処理は、所定のサンプリングレートで繰り返し実行される。

まず、テキスト受付部４８が、本ループの期間において補助装置２４から送信されるテキストデータを受信する（Ｓ３０１）。

そして、音声取得部５０が、Ｓ３０１に示す処理で生成されたテキストデータを、ボイスエージェントサーバ１２に送信する（Ｓ３０２）。

そして、音声取得部５０が、ボイスエージェントサーバ１２から送信される音声データを受信する（Ｓ３０３）。

そして、送信制御部５２が、パーティ管理データ記憶部４０に記憶されているパーティ管理データに基づいて、支援サービス利用フラグの値が１であるユーザデータに対応付けられるボイスチャット装置２０を特定する（Ｓ３０４）。

そして、送信制御部５２が、Ｓ３０４に示す処理により特定されたボイスチャット装置２０に、Ｓ３０３に示す処理で受信した音声データ、及び、Ｓ３０１に示す処理で受け付けたテキストデータを送信する（Ｓ３０５）。なお、Ｓ３０５に示す処理を実行するボイスチャット装置２０自身に対しては、音声データ及びテキストデータは送信されない。

そして、送信制御部５２が、パーティ管理データ記憶部４０に記憶されているパーティ管理データに基づいて、支援サービス利用フラグの値が０であるユーザデータに対応付けられるボイスチャット装置２０を特定する（Ｓ３０６）。

そして、送信制御部５２が、Ｓ３０６に示す処理により特定されたボイスチャット装置２０に、Ｓ３０３に示す処理で受信した音声データを送信して（Ｓ３０７）、Ｓ３０１に示す処理に戻る。なお、Ｓ３０７に示す処理を実行するボイスチャット装置２０自身に対しては、音声データは送信されない。

Ｓ３０５、及び、Ｓ３０７に示す処理で送信された音声データを受信したボイスチャット装置２０では、当該音声データが表す音声が出力される。

Ｓ３０５に示す処理で送信されたテキストデータを受信したボイスチャット装置２０は、当該ボイスチャット装置２０に接続されている補助装置２４に当該テキストデータを送信する。そして当該テキストデータを受信した補助装置２４は、当該補助装置２４のタッチパネル２４ｄに当該テキストデータに含まれるテキストを表示させる。

なお、Ｓ３０５に示す処理において、Ｓ３０１に示す処理で受け付けたテキストデータのみが送信されるようにしてもよい。そしてこの場合、当該テキストデータを受信したボイスチャット装置２０からはＳ３０３に示す処理で受信した音声データが表す音声が出力されなくてもよい。

なお、本発明は上述の実施形態に限定されるものではない。

例えばボイスチャット装置２０、及び、補助装置２４の役割分担は上述のものに限定されない。例えば図９に示すボイスチャット装置２０の機能の一部又は全部が補助装置２４によって実装されてもよい。また例えば図９に示す補助装置２４の機能の一部又は全部がボイスチャット装置２０によって実装されてもよい。

また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。

Claims

ボイスチャットが可能な複数のボイスチャットシステムのうちの１つに含まれるボイスチャット装置であって、
ボイスチャットの音声を受け付ける音声受付部と、
前記音声の音声認識結果であるテキストを取得するテキスト取得部と、
通信相手である前記ボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御する送信制御部と、
テキストを受け付けるテキスト受付部と、
前記テキストの音声合成結果である音声を取得する音声取得部と、
を含み、
前記送信制御部は、前記音声認識結果が表示される通信相手の前記ボイスチャットシステムに前記テキスト受付部が受け付けるテキストを含むテキストデータを送信すると共に、前記音声認識結果が表示されない通信相手の前記ボイスチャットシステムに前記音声合成結果である音声データを送信する、
ことを特徴とするボイスチャット装置。
前記テキスト取得部は、前記複数の前記ボイスチャットシステムのいずれかにおいて音声認識結果が表示されるようになったことに応じて、前記テキストの取得を開始する、
ことを特徴とする請求項１に記載のボイスチャット装置。
前記テキスト取得部は、前記複数の前記ボイスチャットシステムのすべてについて音声認識結果が表示されないようになったことに応じて、前記テキストの取得を停止する、
ことを特徴とする請求項２に記載のボイスチャット装置。
前記送信制御部は、通信相手である前記ボイスチャットシステムに音声認識結果を表示する補助装置が含まれているか否かに応じて、当該通信相手に前記テキストデータを送信するか否かを制御する、
ことを特徴とする請求項１に記載のボイスチャット装置。
前記テキスト取得部は、前記複数の前記ボイスチャットシステムのいずれかにおいて前記補助装置が含まれるようになったことに応じて、前記テキストの取得を開始する、
ことを特徴とする請求項４に記載のボイスチャット装置。
前記テキスト取得部は、前記複数の前記ボイスチャットシステムのすべてについて前記補助装置が含まれないようになったことに応じて、前記テキストの取得を停止する、
ことを特徴とする請求項５に記載のボイスチャット装置。
前記テキスト受付部は、前記ボイスチャット装置と接続されている補助装置に入力される前記テキストを受け付ける、
ことを特徴とする請求項１から６のいずれか一項に記載のボイスチャット装置。
前記テキスト取得部は、前記ボイスチャット装置と通信可能なサーバに前記音声を表す音声データを送信し、
前記テキスト取得部は、前記サーバから前記音声データが表す音声の音声認識結果であるテキストを受信する、
ことを特徴とする請求項１から７のいずれか一項に記載のボイスチャット装置。
前記ボイスチャット装置を含む前記ボイスチャットシステムに、前記音声認識結果が表示される通信相手の前記ボイスチャットシステム及び前記音声認識結果が表示されない通信相手の前記ボイスチャットシステムにより送信されるテキストデータに含まれるテキスト並びに前記テキスト受付部が受け付けるテキストを順次表示手段に表示する手段を含む、
ことを特徴とする請求項１から８のいずれか一項に記載のボイスチャット装置。
ボイスチャットが可能な複数のボイスチャットシステムのうちの１つに含まれるボイスチャット装置が、ボイスチャットの音声を受け付けるステップと、
前記ボイスチャット装置が、前記音声の音声認識結果であるテキストを取得するステップと、
前記ボイスチャット装置が、通信相手である前記ボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御するステップと、
前記ボイスチャット装置が、テキストを受け付けるステップと、
前記ボイスチャット装置が、前記テキストの音声合成結果である音声を取得するステップと、
を含み、
前記送信するか否かを制御するステップは、前記音声認識結果が表示される通信相手の前記ボイスチャットシステムに前記テキストを受け付けるステップで受け付けるテキストを含むテキストデータを送信すると共に、前記音声認識結果が表示されない通信相手の前記ボイスチャットシステムに前記音声合成結果である音声データを送信する、
ことを特徴とするボイスチャット方法。
ボイスチャットが可能な複数のボイスチャットシステムのうちの１つに含まれるボイスチャット装置であるコンピュータに、
ボイスチャットの音声を受け付ける手順、
前記音声の音声認識結果であるテキストを取得する手順、
通信相手である前記ボイスチャットシステムにおいて音声認識結果が表示されるか否かに応じて、当該通信相手に前記テキストを含むテキストデータを送信するか否かを制御する手順、
テキストを受け付ける手順、
前記テキストの音声合成結果である音声を取得する手順、
を実行させることを特徴とするプログラムであって、
前記送信するか否かを制御する手順は、前記音声認識結果が表示される通信相手の前記ボイスチャットシステムに前記テキストを受け付ける手順で受け付けるテキストを含むテキストデータを送信すると共に、前記音声認識結果が表示されない通信相手の前記ボイスチャットシステムに前記音声合成結果である音声データを送信する、
ことを特徴とするプログラム。