JP2023139615A - 再生装置および再生方法 - Google Patents

再生装置および再生方法 Download PDF

Info

Publication number
JP2023139615A
JP2023139615A JP2022045228A JP2022045228A JP2023139615A JP 2023139615 A JP2023139615 A JP 2023139615A JP 2022045228 A JP2022045228 A JP 2022045228A JP 2022045228 A JP2022045228 A JP 2022045228A JP 2023139615 A JP2023139615 A JP 2023139615A
Authority
JP
Japan
Prior art keywords
information
terminal
audio
unit
audio information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022045228A
Other languages
English (en)
Inventor
貴之 荒瀬
Takayuki Arase
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2022045228A priority Critical patent/JP2023139615A/ja
Publication of JP2023139615A publication Critical patent/JP2023139615A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】通信ネットワークを介して接続された複数の端末から送信された音声情報を再生するときに、適正でない音声情報を送信した端末の情報を報知することが可能な再生装置を提供する。【解決手段】再生装置としてのマスター装置10は、端末側情報取得部183と、特定部186と、出力部としてのマスター音声出力部16およびマスター表示部15とを備える。端末側情報取得部183は、通信ネットワーク30を介して接続された複数の生徒端末20-1~20-4から送信された、音声情報と時刻情報とを取得する。特定部186は、取得した音声情報を時刻情報に基づいて同期させて比較することで、適正でない音声が含まれる音声情報に対応する端末を特定する。マスター音声出力部16は、取得した音声情報を再生する。マスター表示部15は、特定部186により特定された端末から取得した音声情報に適正でない音声が含まれることを示す報知情報を出力する。【選択図】図1

Description

本発明は、再生装置および再生方法に関する。
近年、通信ネットワークを介して複数の端末を相互に通信接続させて、各端末で他の複数の端末から送信された映像信号および音声情報を同時に再生させる技術が開発されている。この技術を用いることで、それぞれ異なる場所にいる複数人の間で、リモートから同時にコミュニケーションをとることができる。
特開2012-129950号公報
上述した技術を用いて、ピアノ等の楽器のレッスンをリモートで行うケースが増えつつある。講師1人が複数人の生徒の指導を行うグループレッスンをリモートで行う場合、講師側の端末では、複数の生徒の端末から送信された音声情報を合成して出力する。
グループレッスンで複数の生徒が同時に同じ曲を弾き、その中の1人が弾き間違えた場合に、現実の空間で行うレッスンでは、音の指向性により講師は誰が間違えたのかを判断することができる。しかし、上述したようにリモートでグループレッスンを行う場合は、複数の生徒の端末から送信された音声情報が合成されて出力されるため、講師はどの生徒が間違えたのかを判断し難いという問題があった。
本発明は、通信ネットワークを介して接続された複数の端末から送信された音声情報を再生するときに、適正でない音声情報を送信した端末の情報を報知することが可能な、再生装置および再生方法を提供することを目的とする。
上記目的を達成するための本発明の再生装置は、通信ネットワークを介して接続された複数の端末から送信された、音声情報と時刻情報とを取得する端末側情報取得部と、前記端末側情報取得部が取得した音声情報を、前記時刻情報に基づいて同期させて比較することで、適正でない音声が含まれる音声情報に対応する端末を特定する特定部と、前記端末側情報取得部が取得した音声情報を再生するとともに、前記特定部により特定された端末から取得した音声情報に、適正でない音声が含まれることを示す報知情報を出力する出力部とを備える。
また、本発明の再生方法は、通信ネットワークを介して接続された複数の端末から送信された、音声情報と時刻情報とを取得し、取得した音声情報を、前記時刻情報に基づいて同期させて比較することで、適正でない音声が含まれる音声情報に対応する端末を特定し、取得した音声情報を再生するとともに、特定した端末から取得した音声情報に適正でない音声が含まれることを示す報知情報を出力する。
本発明の再生装置および再生方法によれば、通信ネットワークを介して接続された複数の端末から送信された音声情報を再生するときに、適正でない音声情報を送信した端末の情報を報知することができる。
本発明の一実施形態による再生装置としてのマスター装置を利用リモートレッスンシステムの構成の構成を示すブロック図である。 本発明の一実施形態による再生装置としてのマスター装置に通信接続された生徒端末の構成を示すブロック図である。 本発明の一実施形態による再生装置としてのマスター装置に表示された端末側表示情報の一例を示す画面構成図である。 本発明の一実施形態による再生装置としてのマスター装置が実行する処理の流れを示すフローチャートである。 (a)は、本発明の一実施形態による再生装置としてのマスター装置に表示された所定の端末の映像情報に、適正でないピアノ演奏の音声が含まれることを示す目印情報が重畳された状態を示す図であり、(b)は、通信遅延によるずれが生じていることを示す目印情報が重畳された状態を示す図である。 (a)、(b)は、本発明の一実施形態による再生装置としてのマスター装置に表示された判定結果情報の一例を示す図である。
以下に、本発明の実施形態による再生装置としてのマスター装置を用いたリモートレッスンシステムの構成およびリモートレッスン情報の再生方法について、図面を参照して説明する。本実施形態では、講師Tが、マスター装置を用いて、生徒端末を有する複数の生徒(生徒A、生徒B、生徒C、および生徒D)を対象としたリモートによるピアノのグループレッスンを行う場合について説明する。
〈一実施形態によるリモートレッスンシステムの構成〉
図1は、本発明の一実施形態によるリモートレッスンシステム1の構成を示すブロック図である。リモートレッスンシステム1は、講師Tが用いるマスター装置10と、生徒Aが利用する生徒端末20-1と、生徒Bが利用する生徒端末20-2と、生徒Cが利用する生徒端末20-3と、生徒Dが利用する生徒端末20-4とが、通信ネットワーク30を介して接続されて構成される。本実施形態においては、マスター装置10に通信ネットワーク30を介して接続されている生徒端末の台数が4台の場合を示しているが、これには限定されず、2台、3台、または5台以上であってもよい。以降、生徒端末20-1、20-2、20-3、および20-4のうち、いずれの生徒端末であるかを特定しない場合には、生徒端末20と記載する。
マスター装置10は、マスター入力部11と、マスター撮像部12と、マスター集音部13と、マスター記憶部14と、出力部としてのマスター表示部15およびマスター音声出力部16と、マスター通信部17と、マスターCPU18とを有する。
マスター入力部11は、講師Tの操作情報を入力する。マスター撮像部12は、講師Tを撮影する。マスター集音部13は、講師Tの話し声の音声および講師Tが弾くピアノの音声を集音する。マスター記憶部14は、レッスンに用いる楽曲を演奏したお手本の音声情報を各楽曲の音源として予め記憶する。
マスター表示部15は表示画面を有し、後述するようにマスターCPU18で生成される表示情報を表示する。マスター音声出力部16はスピーカで構成され、後述するようにマスターCPU18で生成される音声出力情報を出力する。マスター通信部17は、通信ネットワーク30を介して各生徒端末20との通信を行う。
マスターCPU18は、テンポ提示部181と、マスター側情報生成部182と、端末側情報取得部183と、映像情報取得部184と、音声情報取得部185と、特定部186と、遅延判定部187と、表示情報生成部188と、音声出力情報生成部189とを有する。
テンポ提示部181は、メトロノームとしての機能を有し、マスター入力部11から入力される情報により設定された時間間隔で拍情報を出力することでテンポを提示する。マスター側情報生成部182は、マスター撮像部12で撮影された映像情報と、マスター集音部13で集音された音声情報と、テンポ提示部181から出力される拍情報とを含むマスター側情報を生成し、各生徒端末20に送信する。
端末側情報取得部183は、後述するように各生徒端末20から送信される、映像情報と音声情報と時刻情報とを含む端末側情報を取得する。映像情報取得部184は、端末側情報取得部183で取得された端末側情報の中から、映像情報を取得する。音声情報取得部185は、端末側情報取得部183で取得された端末側情報の中から、音声情報を取得する。
特定部186は、音声情報取得部185で取得された各生徒端末20の音声情報の中に、適正でないピアノ演奏の音声が含まれる音声情報があるか否かを判定する。特定部186は、該当する音声情報があると判定すると、当該音声情報に対応する生徒端末20を特定する。
遅延判定部187は、端末側情報取得部183で各生徒端末20から受信した端末側情報内の時刻情報に基づいて、対応する生徒端末20との通信遅延が発生しているか否かを判定する。
表示情報生成部188は、生徒端末20ごとに設定された端末表示情報として、映像情報取得部184で取得した各生徒端末20の映像情報を1画面上に並べた表示情報を生成し、マスター表示部15に表示させる。表示情報生成部188は、表示情報の中で、特定部186で特定された生徒端末20に対応する映像情報内に、適正でないピアノ演奏の音声が含まれることを示す目印情報を重畳させる。また表示情報生成部188は、特定部186で特定された生徒端末との通信に遅延が発生している場合には、表示情報の中の該当する生徒端末20に対応する映像情報内に通信遅延によるずれが生じていることを示す情報を重畳する。
音声出力情報生成部189は、音声情報取得部185で取得した各生徒端末20の音声情報を合成して、マスター音声出力部16から出力させる。
図2は、各生徒端末20の構成を示すブロック図である。生徒端末20はそれぞれ、端末表示部21と、端末音声出力部22と、端末撮像部23と、端末集音部24と、端末通信部25と、端末CPU26とを有する。
端末表示部21は表示モニタで構成され、マスター装置10から送信されたマスター側情報に含まれる映像情報を表示する。端末音声出力部22はスピーカで構成され、マスター装置10から送信されたマスター側情報に含まれる音声情報を出力する。端末撮像部23は、当該生徒端末20を操作する生徒を撮影する。端末集音部24は、当該生徒端末20を操作する生徒の話し声の音声および当該生徒が弾くピアノの音声を集音する。端末通信部25は、通信ネットワーク30を介してマスター装置10との通信を行う。
端末CPU26は、マスター側情報取得部261と、端末側情報生成部262とを有する。マスター側情報取得部261は、マスター装置10から送信されたマスター側情報を取得し、マスター側情報に含まれる映像情報を端末表示部21に表示させ、音声情報を端末音声出力部22から出力させる。またマスター側情報取得部261は、マスター情報に含まれる拍情報が表示情報で生成されているときには、対応する拍情報を端末表示部21に表示させ、拍情報が音声情報で生成されているときには、対応する拍情報を端末音声出力部22から出力させる。
端末側情報生成部262は、端末撮像部23で撮影された映像情報と、端末集音部24で集音された音声情報とを含む端末側情報を生成し、生成した端末側情報に該当する時刻情報を付加してマスター装置10に送信する。時刻情報は、例えばGPS(Global Positioning System)を用いて取得することができる。
〈一実施形態によるリモートレッスンシステムの動作〉
次に、本実施形態によるリモートレッスンシステムの動作について説明する。マスター装置10と各生徒端末20との通信を確立させた状態でオンラインレッスンが開始されると、マスター側情報生成部182が、マスター装置10のマスター撮像部12で撮影された講師Tの映像情報とマスター集音部13で集音された講師Tの話し声の音声情報とを含むマスター側情報を生成し、マスター通信部17を介して各生徒端末20に送信する。
各生徒端末20では、マスター装置10から送信されたマスター側情報を端末通信部25から受信し、マスター側情報取得部261が取得する。マスター側情報取得部261は、マスター側情報に含まれる映像情報を端末表示部21に表示させ、音声情報を端末音声出力部22から出力させることで再生させる。生徒A、B、C、およびDは、それぞれ所持する生徒端末20-1、20-2、20-3、および20-4から再生される映像情報および音声情報を視聴する。
また、生徒端末20-1において、端末撮像部23で撮影された生徒Aの映像情報と端末集音部24で集音された生徒Aの話し声の音声情報とを含む第1端末側情報を端末側情報生成部262が生成し、時刻情報を付加して端末通信部25を介してマスター装置10に送信する。同様に、生徒端末20-2が、生徒Bに関する第2端末側情報を生成し、時刻情報を付加してマスター装置10に送信する。同様に、生徒端末20-3が、生徒Cに関する第3端末側情報を生成し、時刻情報を付加してマスター装置10に送信する。同様に、生徒端末20-4が、生徒Dに関する第4端末側情報を生成し、時刻情報を付加してマスター装置10に送信する。
マスター装置10では、生徒端末20-1から送信された第1端末側情報、生徒端末20-2から送信された第2端末側情報、生徒端末20-3から送信された第3端末側情報、および生徒端末20-4から送信された第4端末側情報を、マスター通信部17を介して端末側情報取得部183が取得する。そして、映像情報取得部184が、取得した第1~第4端末側情報に含まれる映像情報を取得し、表示情報生成部188に送出する。表示情報生成部188は、映像情報取得部184で取得した第1~第4端末側情報内の映像情報を1画面内に並べた端末側表示情報を生成し、マスター表示部15に表示させる。
図3は、マスター表示部15に表示された端末側表示情報の一例を示す画面構成図である。図3の端末表示情報では、1画面内に、第1端末側情報内の映像情報P1、第2端末側情報内の映像情報P2、第3端末側情報内の映像情報P3、および第4端末側情報内の映像情報P4が並べて表示されている。
また、音声情報取得部185が、取得した第1~第4端末側情報に含まれる音声情報を取得し、音声出力情報生成部189に送出する。音声出力情報生成部189は、音声情報取得部185で取得した第1~第4端末側情報内の音声情報を合成して、マスター音声出力部16から出力させることで再生させる。
このように、講師Tに関する映像情報および音声情報を各生徒端末20で出力させ、生徒A、B、C、およびDに関する映像情報および音声情報をマスター装置10で出力させることで、講師Tと、生徒A、B、C、およびDとの間でコミュニケーションをとることができる。
レッスン中に、講師Tの指示により、生徒A、B、C、およびDが同時に同じ曲を演奏する場合の処理について説明する。図4は、生徒A、B、C、およびDが同時に同じ曲を演奏する際に、マスター装置10が実行するリモートレッスン情報の再生処理の流れを示すフローチャートである。
講師Tがマスター入力部11から所定速度のテンポの提示を指示する操作を行うと、テンポ提示部181が当該速度に対応する時間間隔で拍情報の出力を開始する。マスター側情報生成部182は、順次生成しているマスター側情報に、テンポ提示部181から出力される拍情報を、音声情報または所定の表示情報として生成して重畳する。各生徒端末20では、マスター側情報に重畳された拍情報が所定時間間隔で出力され、生徒A、B、C、およびDは、演奏する曲のテンポを認識することができる。この操作は、マスター撮像部12により講師Tのジェスチャを撮像して画像認識によってなされてもよいし、マスター集音部13により講師Tの音声を集音して音声認識によってなされてもよい(図示せず)。
そして講師Tがマスター入力部11から演奏開始を指示する操作を行うと、マスター側情報生成部182がマスター側情報に、拍情報の出力タイミングに合わせて開始指示情報「3、2、1、はい」を、音声情報または表示情報として重畳する。各生徒端末20では、マスター側情報に重畳された開始指示情報が出力され、生徒A、B、C、およびDは、演奏開始のタイミングを認識することができる。この操作は、マスター撮像部12により講師Tのジェスチャを撮像して画像認識によってなされてもよいし、マスター集音部13により講師Tの音声を集音して音声認識によってなされてもよい(図示せず)。
生徒A、B、C、およびDは、出力された演奏開始情報に基づいて認識したタイミングで演奏を開始し、開始後は出力されている拍情報に合わせて演奏を継続する。生徒A、B、C、およびDの演奏が開始すると(S1の「YES」)、特定部186が、音声情報取得部185で取得された所定期間の生徒端末20-1~20-4音声情報をバッファリングする(S2)。この所定期間は例えば、演奏している楽曲の1小節分の期間である。
特定部186は、バッファリングした音声情報を解析することで、各生徒端末20-1~20-4の音声情報の中に、適正でないピアノ演奏の音声が含まれる音声情報があるか否かを判定する(S3)。適正でないピアノ演奏の音声とは、音が間違っている、途中で止まった、または、速さがずれている、例えば遅れている演奏の音声である。
特定部186が、各生徒端末20-1~20-4の音声情報の中に適正でないピアノ演奏の音声が含まれる音声情報があるか否かを判定する判定処理の具体例として、以下に4つの判定処理(1)~(4)を挙げて説明する。特定部186は、判定処理(1)~(4)のうちの1つを用いて、または複数を組み合わせて判定する。
[判定処理(1)]
判定処理(1)では、特定部186は、バッファリングした期間の各生徒端末20-1~20-4の音声情報の分析情報として、例えば波形データを生成し、各音声情報に付加されている時刻情報に基づいてこれらの波形データを同期させ、類似度に基づいて波形データをクラスタリングする。そして特定部186は、クラスタリングした波形データのうち、異なるグループに分類されるか、または同じグループに分類されても類似度が所定値以下となる波形データがある場合、当該波形データを構成する音声情報を、適正でないピアノ演奏の音声が含まれる音声情報と判定する。
この判定方法は上記クラスタリングに限られない。各波形データの差分を算出して、差分値が所定値より大きいか否かによって判定しても良い。また、各波形データの相関値を算出して、相関値が所定値より低いか否かによって判定しても良い。さらに、各波形データのスペクトル解析により、周波数成分が平均値からの所定の範囲より乖離しているか否かによって判定しても良い。
[判定処理(2)]
判定処理(2)では、特定部186は、生徒端末20-1~20-4の中で音声情報の正確さに基づいて予め設定された重み付け情報を予め保持する。この重み付け情報は、ピアノ演奏の上級者が用いる生徒端末20に対しては高い値で設定され、初心者が用いる生徒端末20に対しては低い値で設定される。この重み付け情報は、予め設定せず、その都度講師Tが手動で設定しても良い。また、この重み付け情報は、これまでの演奏の履歴から、適正でないと判断された頻度が高いほど初心者とし、適正でないと判断された頻度が低いほど上級者として、自動的に設定しても良い。この場合、生徒の端末と、適正でないと判断された頻度とが対応付けられて特定部186に保存される。
特定部186は、バッファリングした期間の各生徒端末20-1~20-4の音声情報それぞれに対応する波形データを生成し、各音声情報に付加されている時刻情報に基づいてこれらの波形データを同期させて比較し、重み付け情報の値が高い生徒端末20の音声情報に関する波形データとの相関値が所定値よりも低い音声情報を、適正でないピアノ演奏の音声が含まれる音声情報と判定する。
[判定処理(3)]
判定処理(3)を行う場合、講師Tも生徒A、B、C、およびDと同じタイミングで該当楽曲を演奏する。特定部186は、マスター集音部13で集音された講師Tの演奏の音声情報を、各生徒端末20-1~20-4の音声情報と同様に所定期間分バッファリングする。特定部186は、バッファリングした期間の各生徒端末20-1~20-4の音声情報それぞれに対応する波形データと、講師Tの演奏の音声情報に関する波形データとを生成し、各音声情報に付加されている時刻情報に基づいてこれらの波形データを同期させて比較し、その相関値を類似度として算出する。そして特定部186は、各生徒端末20-1~20-4の音声情報のうち、対応する波形データと、講師Tの演奏の音声情報に関する波形データとの相関値が所定値よりも低い音声情報を、適正でないピアノ演奏の音声が含まれる音声情報と判定する。
[判定処理(4)]
判定処理(4)を行う場合、特定部186は、マスター記憶部14から該当する楽曲の音源の音声情報を取得し、各生徒端末20-1~20-4の音声情報と同様に所定期間分バッファリングする。特定部186は、バッファリングした期間の各生徒端末20-1~20-4の音声情報に関する波形データと、音源の音声情報に関する波形データとを生成し、各音声情報に付加されている時刻情報に基づいてこれらの波形データを同期させて比較し、その相関値を類似度として算出する。そして特定部186は、各生徒端末20-1~20-4の音声情報のうち、対応する波形データと、音源の音声情報に関する波形データとの相関値が所定値よりも低い音声情報を、適正でないピアノ演奏の音声が含まれる音声情報と判定する。
特定部186は、適正でないピアノ演奏の音声が含まれると判定した音声情報に対応する生徒端末20を特定する(S4)。ここでは、生徒端末20-2が対応当する生徒端末として特定される。
特定部186は、遅延判定部187による判定結果に基づいて、対応する生徒端末20-2との通信に遅延が生じているか否かを判定する(S5)。特定部186が、生徒端末20-2との通信に遅延が生じていないと判定したときには(S5の「NO」)、表示情報生成部188が図5(a)に示すように、マスター表示部15の生徒端末20-2に対応する第2端末側情報の映像情報P2内に目印情報(アイコン情報)Q1を重畳する。このアイコン情報Q1は、適正でないピアノ演奏の音声が含まれることを示す報知情報である。
また特定部186が、生徒端末20-2との通信に遅延が生じていると判定したときには(S5の「YES」)、表示情報生成部188が図5(b)に示すように、マスター表示部15の生徒端末20-2に対応する第2端末側情報の映像情報P2内にアイコン情報Q2を重畳する。このアイコン情報Q2は、生徒端末20-2から取得した音声情報に通信遅延によるずれが生じていることを示す報知情報である。
表示情報生成部188は、アイコン情報Q1またはQ2を重畳して表示させてから所定時間、例えば1秒間が経過すると(S8の「YES」)、重畳したアイコン情報Q1またはQ2を表示情報から削除する(S9)。
その後、演奏が終了していなければ(S10の「NO」)、マスター装置10はステップS2に戻り、次の所定期間、例えば次の小節に関する各生徒端末20の音声情報をバッファリングして(S2)、上述した処理と同様にステップS3以降の処理を実行する。ステップS3において適正でないピアノ演奏の音声が含まれる音声情報がないと判定されたときには(S3の「NO」)、ステップS10に移行する。演奏が終了すると(S10の「YES」)、ステップS1に戻り、次の演奏が開始するまで待機する(S1の「NO」)。
上述した処理中に、特定部186が、演奏された曲の中でどの生徒端末20に関してどの箇所で適正でないピアノ演奏の音声が含まれると判定したかを記憶しておき、表示情報生成部188が、記憶した情報を判定結果情報としてマスター表示部15に表示させてもよい。
例えば表示情報生成部188は、判定結果情報として図6(a)に示すように、該当する曲の開始から終了までの時間を示した時間軸バーLと、時間軸バーLに対応する曲の小節数(図6内の「5」、「9」)と、適正でないピアノ演奏の音声が含まれると判定された音声情報に対応する生徒の識別情報と、時間軸バーL内の該当する箇所を矢印で示す情報とを表示する。
また他の例として、表示情報生成部188は図6(b)に示すように、該当する曲の楽譜の情報と、適正でないピアノ演奏の音声が含まれると判定された音声情報に対応する生徒の識別情報と、楽譜の中の該当する箇所を矢印で示す情報とを判定結果情報として表示してもよい。図6(a)および(b)では、生徒Bが、9小節目の直前で弾き間違えをしたことにより、対応する箇所に生徒Bの識別情報が表示されている。
以上のステップS1~S10の処理は、オンラインレッスン中、繰り返される。
上述した実施形態によれば、マスター装置10は、通信ネットワーク30を介して接続された複数の生徒端末20-1~20-4から送信されたピアノ演奏の音声情報を再生するときに、適正でないピアノ演奏の音声が含まれる音声情報を送信した生徒端末の情報を報知情報として出力し、表示させる。これにより、マスター装置10を用いる講師Tは、どの生徒の演奏が適正でなかったかを認識することができる。
またマスター装置10の特定部186は、生徒端末20-1~20-4から取得した音声情報のうち、他の生徒端末20の音声情報との類似度が所定値よりも低い音声情報か、または生徒端末20の音声情報とは異なる所定の音声情報との類似度が所定値よりも低い音声情報を適正でない音声が含まれる音声情報と判定し、判定した音声情報に対応する生徒端末20を特定する。このように特定処理を行うことで、特定部186は高い精度で、適正でない音声が含まれる音声情報に対応する端末を特定することができる。
またマスター装置10の遅延判定部187は、端末側情報取得部183が取得した時刻情報に基づいて、対応する生徒端末20との通信遅延が発生しているか否かを判定し、表示情報生成部188は、特定部186で特定された生徒端末20に関し、遅延判定部187で通信遅延が発生していると判定されていれば、該当する生徒端末20から取得した音声情報には通信遅延によるずれが生じていることを示す報知情報を出力する。そして、マスター表示部は、この報知情報を表示する。このように報知処理を行うことで、講師Tは、所定の音声情報に対して適正でないと判定された要因が通信遅延によるものであったことを認識することができる。報知情報は、音声出力情報生成部189により各端末が区別できるように音像を定位させ、マスター音声出力部16から出力するようにしても良い。
また上述した実施形態において、特定部186が適正でない音声が含まれる音声情報に対応する生徒端末20を特定する際に、端末側情報取得部183が取得した映像情報の解析情報をさらに加えて該当する生徒端末20を判断してもよい。
具体的には、特定部186は、各生徒端末20-1~20-4から取得した映像情報を解析して、演奏が開始してからの時間ごとに生徒が押している鍵盤の位置を特定する。そして、適正な位置の鍵盤を押していない生徒が映っている映像情報があると判定すると、該当する映像情報に対応する生徒端末20を、適正でない音声が含まれる音声情報に対応する生徒端末20として特定する。このように特定処理を行うことで、特定部186はさらに精度良く、適正でない音声が含まれる音声情報に対応する端末を特定することができる。
上述した実施形態では、マスター装置10のマスター表示部15に表示させる生徒端末20ごとの端末表示情報が、各生徒端末20の映像情報である場合について説明したが、これには限定されない。例えば、各生徒端末20を利用する生徒の顔画像、名前を示したテキスト情報等を端末表示情報として1画面上に並べて、マスター表示部15に表示させてもよい。また、ピアノ以外の任意の楽器や任意の音声を対象としたレッスンにも上述の実施形態を適用できる。
1 リモートレッスンシステム
10 マスター装置
11 マスター入力部
12 マスター撮像部
13 マスター集音部
14 マスター記憶部
15 マスター表示部
16 マスター音声出力部
17 マスター通信部
18 マスターCPU
20、20-1~20-4 生徒端末
21 端末表示部
22 端末音声出力部
23 端末撮像部
24 端末集音部
25 端末通信部
26 端末CPU
30 通信ネットワーク
181 テンポ提示部
182 マスター側情報生成部
183 端末側情報取得部
184 映像情報取得部
185 音声情報取得部
186 特定部
187 遅延判定部
188 表示情報生成部
189 音声出力情報生成部
261 マスター側情報取得部
262 端末側情報生成部

Claims (5)

  1. 通信ネットワークを介して接続された複数の端末から送信された、音声情報と時刻情報とを取得する端末側情報取得部と、
    前記端末側情報取得部が取得した音声情報を、前記時刻情報に基づいて同期させて比較することで、適正でない音声が含まれる音声情報に対応する端末を特定する特定部と、
    前記端末側情報取得部が取得した音声情報を再生するとともに、前記特定部により特定された端末から取得した音声情報に適正でない音声が含まれることを示す報知情報を出力する出力部と、を備える再生装置。
  2. 前記特定部は、前記端末側情報取得部が取得した音声情報のうち、他の端末の音声情報との類似度が所定値よりも低い音声情報か、または前記複数の端末の音声情報とは異なる所定の音声情報との類似度が所定値よりも低い音声情報を、適正でない音声が含まれる音声情報と判定し、判定した音声情報に対応する端末を特定する、請求項1に記載の再生装置。
  3. 前記端末側情報取得部が取得した時刻情報に基づいて、対応する端末との通信遅延が発生しているか否かを判定する遅延判定部をさらに備え、
    前記出力部は、前記特定部で特定された端末に関し、前記遅延判定部で通信遅延が発生していると判定されていれば、該当する端末から取得した音声情報には通信遅延によるずれが生じていることを示す報知情報を出力する、請求項1または2に記載の再生装置。
  4. 前記端末側情報取得部は、前記複数の端末から映像情報をさらに取得し、
    前記特定部は、前記端末側情報取得部が取得した映像情報を解析することで、適正でない音声が含まれる音声情報に対応する端末を特定する、請求項1~3いずれか1項に記載の再生装置。
  5. 通信ネットワークを介して接続された複数の端末から送信された、音声情報と時刻情報とを取得し、
    取得した音声情報を、前記時刻情報に基づいて同期させて比較することで、適正でない音声が含まれる音声情報に対応する端末を特定し、
    取得した音声情報を再生するとともに、特定した端末から取得した音声情報に適正でない音声が含まれることを示す報知情報を出力する、再生方法。
JP2022045228A 2022-03-22 2022-03-22 再生装置および再生方法 Pending JP2023139615A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022045228A JP2023139615A (ja) 2022-03-22 2022-03-22 再生装置および再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022045228A JP2023139615A (ja) 2022-03-22 2022-03-22 再生装置および再生方法

Publications (1)

Publication Number Publication Date
JP2023139615A true JP2023139615A (ja) 2023-10-04

Family

ID=88204908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022045228A Pending JP2023139615A (ja) 2022-03-22 2022-03-22 再生装置および再生方法

Country Status (1)

Country Link
JP (1) JP2023139615A (ja)

Similar Documents

Publication Publication Date Title
WO2019095446A1 (zh) 一种具有语音评价功能的跟随教学系统
JP5257966B2 (ja) 音楽再生制御システム、音楽演奏プログラム、および演奏データの同期再生方法
US10235898B1 (en) Computer implemented method for providing feedback of harmonic content relating to music track
JP2008170685A (ja) 音声評価装置及びカラオケ装置
CN108766408A (zh) 一种电子乐器合奏系统和方法
JPS6013190B2 (ja) 音楽教育装置
CN109657099A (zh) 一种学习互动方法及学习客户端
KR20190093770A (ko) 인공지능기반 맞춤형 음악추천에 따른 학습생성데이터의 다자간 모바일 컨텐츠 공유서비스 및 시스템
CN110853624A (zh) 言语康复训练系统
KR20140041266A (ko) 모바일 컨텐츠를 이용한 댄스 및 노래 학습 서비스 제공 장치 및 방법
JP2002091291A (ja) ピアノ教授用データ通信システム
CN113286183B (zh) 演奏过程与曲谱同步显示的方法、装置、设备及存储介质
US7038120B2 (en) Method and apparatus for designating performance notes based on synchronization information
JPWO2018207936A1 (ja) 譜面自動検出方法および装置
JP2013174712A (ja) 携帯端末装置用プログラム、情報提示方法及び携帯端末装置
CN108922275B (zh) 远程教育系统及教育方法
US9092992B2 (en) System and method for music education
JP2023139615A (ja) 再生装置および再生方法
CN112119456A (zh) 任意信号插入方法以及任意信号插入系统
KR20190004215A (ko) 시창평가 시스템 및 그것을 이용한 시창평가방법
CN110164242B (zh) 一种声乐演唱模拟训练平台
JP2013029744A (ja) カラオケ装置
JP4048249B2 (ja) カラオケ装置
JP2016139038A (ja) 反復再生機能を備えるカラオケ端末
JP2020014132A (ja) 情報処理方法および情報処理装置