JP2004347906A - Educational system and speech input/output apparatus - Google Patents
Educational system and speech input/output apparatus Download PDFInfo
- Publication number
- JP2004347906A JP2004347906A JP2003145718A JP2003145718A JP2004347906A JP 2004347906 A JP2004347906 A JP 2004347906A JP 2003145718 A JP2003145718 A JP 2003145718A JP 2003145718 A JP2003145718 A JP 2003145718A JP 2004347906 A JP2004347906 A JP 2004347906A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- audio
- input
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、音声入出力装置等を有して、双方向に音声情報を送受信することにより教育を支援する教育システム等に関する。
【0002】
【従来の技術】
従来から、テレビ会議システムを用いた、教育システムがある。本テレビ会議システムは、正当な受講資格を有する者であることを認証する認証機能、複数の生徒同士を分けるグループ分け機能等の教育に必要な機能を備えたシステムである(特許文献1参照)。例えば、本テレビ会議システムを用いて、英会話教育を行う場合、本システムは、上記のグループ分け機能により、同じレベルの生徒同士を同一のグループに構成し、グループ内の生徒同士が会話の練習を行えるようにする。すなわち、英会話力に差がある生徒同士が練習を行わせるよりも、同等の英会話力を有する生徒同士に会話練習を行わせて、効率的に英会話力を向上させることを提供する。また、本システムは、正当な受講資格を有する者であるか否かを判断でき、不正な者が受講できないようにすることを提供する。
【0003】
【特許文献1】
特開2001−224000号公報(第1頁、第1図等)
【0004】
【発明が解決しようとする課題】
しかしながら、テレビ会議システムを用いた教育システムは、以下の潜在的な問題を有する。利用者(特に、子供)は、モニター画面またはスピーカーの音声に対して、長時間耐えられない、または集中できない等の問題がある。なぜならば、利用者は、モニター画面の向こうにいる人(先生)からでなく、感情のない機械から教わっているように感じ、結果、授業がつまらなくなり、集中力が低下する。また、直接、人間同士が接する授業のように、緊張感が生じにくいため、利用者は、授業に集中できず、学習効果が上がらない。
【0005】
【課題を解決するための手段】
以上の課題を解決するために、本発明は、第一音声入出力装置と第二音声入出力装置を有し、二つの音声入出力装置により双方向に音声情報を送受信することにより教育を行うことを支援する教育システムであって、少なくとも一方の音声入出力装置から入力された音声情報を他方の音声入出力装置に出力する際に、音声変換を行う教育システムである。かかるシステムは、出力される音声を変換し、利用者が長時間耐えられる、または集中できる環境を提供する。よって、利用者は、集中して学習できる。
【0006】
また、他の本発明は、上記の音声変換された音声がキャラクタの音声である教育システムである。かかるシステムにより、入力された音声が、他方で出力される際に、キャラクタの音声で出力される。例えば、キャラクタの音声が漫画の主人公の声である場合に、利用者(特に、子供)は、集中して、楽しく学習できる。
【0007】
また、他の本発明は、上記の音声変換された音声がユーザにより指定された音声である教育システムである。かかるシステムにより、入力された音声が、他方で出力される際に、ユーザが指定した音声で出力される。例えば、ユーザが指定した音声が利用者の憧れの俳優の声である場合に、利用者は、集中して、楽しく学習できる。
【0008】
【発明の実施の形態】
【0009】
以下に、本発明の実施の形態について、図面を用いて詳細に説明する。なお、本実施の形態において、同一の符号を用いた構成要素やフローチャートのステップなどは、同じ機能を果たすので、一度説明したものについて説明を省略する場合がある。
【0010】
(実施の形態1)
図1は、本実施の形態における教育システムの構成を示すブロック図である。教育システムは、第一端末101と第二端末102を有する。第一端末101は、第一音声入出力装置1011、第一映像入出力装置1012、第一送受信部1013を有する。第一音声入出力装置1011は、第一音声入力部10111、第一音声出力部10112、音声変換部10113を有する。また、第一映像入出力装置1012は、第一映像入力部10121、第一映像出力部10122を有する。第二端末102は、第二音声入出力装置1021、第二映像入出力装置1022、第二送受信部1023を有する。第二音声入出力装置1021は、第二音声入力部1021、第二音声出力部1022を有する。また第二映像入出力装置1022は、第二映像入力部10121、第二映像出力部10122を有する。
【0011】
第一音声入力部10111は、第一ユーザの音声の入力を受け付ける。第一音声入力部10111は、通常、マイクロホンおよびそのドライバーソフト等により実現され得る。
【0012】
第一音声出力部10112は、第二ユーザの音声情報を出力する。第一音声出力部10112は、通常、スピーカーおよびそのドライバーソフト等により実現され得る。
【0013】
音声変換部10113は、第一送受信部1013が受信した第二ユーザの音声情報を、例えば、キャラクタの音声を表す情報に、またはユーザにより指定された音声情報に変換する。音声情報とは、音声に関する情報であり、例えば、音声を電気信号に変換した情報等を有する。また、キャラクタの音声を表す情報とは、例えば、テレビ漫画のキャラクター(声優)の音声、俳優の音声、美しく澄んだ音声、アナウンサーの音声、ユーザ自身の音声、ユーザの知り合いの音声、その他の音声を表す情報等である。また、ユーザにより指定された音声情報とは、例えば、上記キャラクタの音声情報等である。音声情報を指定する手段は、例えば、音声指定手段等(例えば、指定ボタンを押す等)により実現されうる。音声変換の方法は、例えば、音声情報に所定の合成処理を行い、予め決められた、または指定のキャラクタの音声に変換する方法等である。この合成処理は、例えば、加算合成(例えば、周波数発信器と加算器により構成される処理)、減算合成(所定の周波数フィルター処理)、音を揺らす処理、倍音を少しずらす処理、高・低音部を強調する(基音と倍音の比率を変える)処理、周波数を変化させて音程を変化させる処理等、または上記の処理の組み合わせにより合成する処理等である。また、音声変換の方法は、以下の方法でもよい。まず、音声情報を認識(例えば、基本周波数、ホルマント等の周波数の特徴を抽出して、認識)する。次に、認識された音声情報を文字データに変換する。次に、当該文字データに相当するキャラクタの音声波形を取得して、文字データに基づいて、音声波形を合成する。なお、キャラクタの音声波形は、音声変換部10113に内蔵の記録媒体に予め記録されている。音声変換部10113は、通常、MPUやメモリ等から実現され得る。音声変換するための処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0014】
第一映像入力部10121は、第一ユーザの映像の入力を受け付ける。第一映像入力部10121は、映像入力手段等で実現できる。第一映像入力部10121は、例えば、デジタルビデオカメラ等が好適である。
【0015】
第一映像出力部10122は、第一送受信部1013が受信した第二ユーザの映像情報を出力する。第一映像出力部10122は、例えば、ディスプレイとそのドライバーソフト等により実現される。
【0016】
第一送受信部1013と第二送受信部1023は、音声情報、映像情報等を送信または受信する。映像情報とは、映像の情報であり、例えば、映像入力部が入力を受け付けたユーザの映像の情報等である。第一送受信部1013と第二送受信部1023は、例えば、ネットワークカードとそのドライバーソフト等を有して実現される。なお、音声情報と映像情報は、多重化されて送信されても良く、送信の形態は、問わない。かかる送信の形態は、他の実施の形態においても同様である。
【0017】
第二音声入力部10211は、第二ユーザの音声の入力を受け付ける。第二音声入力部10211は、通常、マイクロホンおよびそのドライバーソフト等により実現され得る。
【0018】
第二音声出力部10212は、第二送受信部1023が受信した第一ユーザの音声情報を出力する。第二音声出力部10212は、通常、スピーカーおよびそのドライバーソフト等により実現され得る。
【0019】
第二映像入力部10221は、第二ユーザの映像の入力を受け付ける。第二映像入力部10221は、映像入力手段等で実現できる。第二映像入力部10221は、例えば、デジタルビデオカメラ等が好適である。
【0020】
第二映像出力部10222は、第二送受信部1023が受信した第一ユーザの映像情報を出力する。第二映像出力部10222は、例えば、ディスプレイとそのドライバーソフト等により実現される。
【0021】
以下、本実施の形態における第一端末101において、音声および映像を入力し、音声情報および映像情報を外部装置(例えば、第二端末102等)に送信する動作について図2のフローチャートを用いて説明する。
【0022】
(ステップS201)第一端末101は、第二端末102と接続する入力を受け付けたか否かを判断する。第一端末101が第二端末102と接続する入力を受け付けた場合、ステップS202に行き、受け付けない場合、ステップS201に戻る。なお、接続する入力は、第一端末101の電源スイッチをONにする入力、または接続スイッチをONにする入力等のものでも良く、その他の入力手段でも良い。また、接続する入力は、第二端末102が送信した接続信号(接続する旨の信号)を受信したことでも良い。
【0023】
(ステップS202)第一音声入力部10111は、音声の入力を受け付けたか否かを判断する。また、第一映像入力部10121は、映像の入力を受け付けたか否かを判断する。第一音声入力部10111または第一映像入力部10121は、音声および映像の入力を受け付けた場合、ステップS203に行き、受け付けなければ、ステップS202に戻る。
【0024】
(ステップS203)第一送受信部1013は、ステップS202で入力を受け付けた音声情報および映像情報を第二端末102に送信する。
【0025】
(ステップS204)第一端末101は、第二端末102との接続を切断する入力を受け付けたか否かを判断する。第一端末101は、第二端末102との接続を切断する入力を受け付けた場合、第一端末101の動作は終了し、切断する入力を受け付けない場合、ステップS202に行く。なお、切断する入力は、第一端末101の電源スイッチをOFFにする入力、または接続スイッチをOFFにする入力等のものでも良い。
【0026】
なお、第二端末102において音声および映像を入力し、外部装置(例えば、第一端末101等)に送信する動作は、上記フローチャートで説明した動作と同様である。また、本実施の形態は、映像の入力を受け付けない、映像情報を送受信しない、および映像情報を出力しないものでも良い。かかる形態は、他の実施の形態においても同様である。
【0027】
以下、本実施の形態における第一端末101において、第二端末102から音声情報及び映像情報を受信し、音声情報を音声変換し、出力する動作について図3のフローチャートを用いて説明する。
【0028】
(ステップS301)第一端末101は、第二端末102と接続する入力を受け付けたか否かを判断する。第一端末101が第二端末102と接続する入力を受け付けた場合、ステップS302に行き、受け付けない場合、ステップS301に戻る。なお、接続する入力の手段は、ステップS201と同様である。
【0029】
(ステップS302)第一送受信部1013は、第二端末102から音声情報および映像情報を受信したか否かを判断する。第一送受信部1013が、音声情報および映像情報を受信した場合、ステップS303に行き、受信しない場合には、ステップS302に戻る。
【0030】
(ステップS303)第一音声出力部10112は、ステップS302で受信された音声情報を、予め決められた音声情報、またはユーザによって指定されたキャラクタの音声情報に音声変換する。
【0031】
(ステップS304)第一音声出力部10112は、ステップS303で音声変換された、キャラクタの音声情報を出力する。
【0032】
(ステップS305)第一映像出力部10122は、ステップS302で受信された映像情報を出力する。
【0033】
(ステップS306)第一端末101は、第二端末102との接続を切断する入力を受け付けたか否かを判断する。第一端末101は、第二端末102との接続を切断する入力を受け付けた場合、第一端末101の動作は終了し、切断する入力を受け付けない場合、ステップS302に行く。なお、切断する入力の手段は、ステップS204と同様である。
【0034】
なお、第二端末102において音声情報および映像情報を受信し、出力する動作は、上記フローチャートで説明した動作と同様である。
【0035】
以下、本実施の形態における教育システム(英会話教育のシステム)の具体的な動作について説明する。図4は、本実施の形態における教育システムの概念の例を示す図である。図4において、今、第一端末401は、パソコン402のモニター4021の上に設置されている。また、第一端末401は、デジタルビデオカメラ4011を有し、またマイク付きヘッドホン4012(音声入出力装置)と専用線を介して接続されている。第二端末411は、テレビ412のテレビ画面4121の上に設置されている。また、第二端末411は、デジタルビデオカメラ4111を有し、またマイク付きヘッドホン4112(音声入出力装置)と専用線を介して接続されている。また、第一端末401、第二端末411、教育システムのサーバー装置420は、インターネットを介して接続されている。モニター4021は、第二端末411側のユーザの映像が出力されている。またテレビ画面4121は、第一端末401側のユーザの映像が出力されている。なお、第一端末401は、生徒である。また、第二端末411は、英会話の先生である。
【0036】
また教育システムのサーバー装置420は、以下の動作を行う。例えば、サーバー装置420は、日々の授業内容(授業スケジュール)を出力指示する、または授業の終了時間を出力指示する等を行う。また、サーバー装置420は、第一端末401と第二端末411のアクセス許可の判断を行い、例えば、不正に授業を受ける者が存在する場合に、第一端末401と第二端末411を接続しないようにする等の動作を行う。また、サーバー装置420は、例えば、複数の端末から音声情報および映像情報を受信し、各端末に送信する等を行う。
【0037】
以下、音声情報をキャラクタの音声に変換する動作について具体的に説明する。マイク付きヘッドホン4112のマイクは、第二端末411側のユーザが発声した音声を、取得し、電気信号(音声情報)に変換する。第二送受信部は、当該音声情報を、第一端末401に送信する。第一送受信部は、当該音声情報を受信する。
【0038】
次に、音声変換部10113は、受信した音声情報を、予め決められたキャラクタの音声を表す情報に変換する。または、ユーザにより指定された音声情報に変換する。予め決められたキャラクタの音声を表す情報が、テレビ漫画Aの主人公Bの音声を表す情報である場合、主人公Bの音声波形データは、音声変換部10113に内蔵の記録媒体に、予め記録されている。また、ユーザにより指定された音声情報に変換する場合、指定された音声情報の音声波形データは、音声変換部10113に内蔵の記録媒体に予め、記録されている。ここで音声波形データは、例えば、主人公Bの音声を再現できる波形データである。当該波形データのデータ構造は問わない。
【0039】
また、ユーザがキャラクタの音声情報を指定する方法は、例えば、ユーザが、毎回、指定ボタン(音声指定手段)を押して、当該指定ボタンに応じたキャラクタの音声情報を指定する方法等である。また、キャラクタの音声情報を毎回指定せず、前回指定されたキャラクタの音声情報が、指定されるものでも良い。
【0040】
音声変換部10113は、受信した音声情報の基本周波数、ホルマント等の周波数の特徴を検出する。次に、受信した音声情報とキャラクタの音声波形データの各々の基本周波数、ホルマント等のデータを比較減算する。比較減算の結果が零(つまり、値が一致する)または、ほぼ零になるように、音声変換部10113は、受信した音声情報に上記の合成処理を行う。なお、上記の合成処理以外の処理を行い、音声変換するものでも良い。
【0041】
また、音声変換部10113は、以下に示す方法で音声変換するものでも良い。まず、音声変換部10113は、受信した音声情報を認識(例えば、基本周波数、ホルマント等の周波数の特徴を抽出して、認識)する。次に、音声変換部10113は、認識された音声情報を文字データに変換する。次に、音声変換部10113は、当該文字データに相当するキャラクタの音声波形を取得して、文字データに基づいて、音声波形を合成する。
【0042】
次に、マイク付きヘッドホン4012は、音声変換部10113が変換した音声情報を出力する。よって、第二端末411側のユーザの音声を、予め決められた、またはユーザが指定したキャラクタの音声で、第一端末401側のユーザは、聞くことができる。
【0043】
なお、第一端末401側のユーザが発声した音声を、マイク付きヘッドホン4012のマイクは、取得し、電気信号(音声情報)に変換する。第一送受信部は、当該音声情報を、第二端末411に送信する。第二送受信部は、当該音声情報を受信する。第二音声出力部のマイク付きヘッドホン4112は、当該音声情報を音声に変換して出力する。
【0044】
なお、本実施の形態において、音声変換部10113は、第一端末401に内蔵されているものだったが、音声変換部10113は、第二端末411、またはサーバー装置420に内蔵されているものでも良い。音声変換部10113がサーバー装置420に内蔵されている場合、第二端末411は、音声情報をサーバー装置420に送信し、サーバー装置420は、音声情報を受信し、当該音声情報を音声変換し、変換された音声情報を、第一端末401に送信する。また、音声変換部10113が第二端末411に内蔵されている場合、第二端末411は、音声情報を音声変換し、当該音声変換した音声情報を第一端末401に送信する。
【0045】
また、本実施の形態において、第二端末411は、音声変換部を有さないものだったが、第二端末411は、音声変換部を有するものでも良い。かかる場合、第二端末411は、第一端末401側のユーザの音声をキャラクタの音声に変換して、出力できる。
【0046】
また、本実施の形態において、映像出力部は、他方の端末から入力された映像を出力するものだったが、他方の音声情報をキャラクタの音声情報に変換することに応じて、映像出力部は、かかるキャラクタの映像情報を出力するものでも良い。なお、キャラクタの映像情報は、端末に内蔵の記録媒体に格納されているものでも良く、サーバー装置に内蔵の記録媒体に格納されているものでも良い。
【0047】
以上、本実施の形態によれば、第二端末で入力された音声が、第一端末で出力される場合に、キャラクタの音声情報で出力される。例えば、キャラクタの音声がテレビ漫画の主人公の声である場合に、利用者(特に、子供)は、集中して、楽しく学習できる。また、例えば、ユーザが指定した音声が利用者の憧れの俳優の声である場合に、利用者は、集中して、楽しく学習できる。さらに、同一人物(例えば、キャラクタA)が別々の授業を同時に行うことは物理的に不可能であった。本発明によれば、入力された先生の音声をキャラクタAの音声に音声変換できる。よって、同時に行われる別々の授業であっても、各々の生徒は、キャラクタAの音声で授業を受けることができる。例えば、授業内容が異なるクラスAの授業とクラスBの授業が同時に行われる場合、クラスA、Bの生徒は、人気の高いキャラクタAの音声で同時に授業を受けることができる。よって、クラスA、Bの生徒は、授業に集中でき、学習効果も向上する。
【0048】
さらに、本実施の形態において説明した教育システムの動作について、ソフトウェアで実現し、当該ソフトウェアを例えば、サーバー上に置いて、ソフトウェアダウンロードにより当該ソフトウェアを配布しても良い。さらにソフトウェアをCD−ROM等の記録媒体に記録して流布しても良い。このことは、すべての他の実施の形態においても同様である。なお、本実施の形態における動作をソフトウェアで実現した場合のプログラムは、以下のようになる。コンピュータに、少なくとも一方の音声入出力装置から入力された音声情報を受信する音声情報受信ステップと、当該受信した音声情報を音声変換する音声変換ステップと、当該音声変換された音声情報を出力する音声情報出力ステップを実行させるためのプログラムである。なお、音声情報出力ステップにおける、音声変換された音声情報を出力するとは、他の音声入出力装置に送信することを含む概念である。
【0049】
(実施の形態2)
図5は、本実施の形態における教育システムの構成を示すブロック図である。教育システムは、第一端末501、第二端末102、サーバー装置503を有する。第一端末501は、第一音声入出力装置5011、第一映像入出力装置1012、第一送受信部1013を有する。第一音声入出力装置5011は、第一音声入力部10111、第一音声出力部10112を有する。また、第一映像入出力装置1012は、第一映像入力部10121、第一映像出力部10122を有する。サーバー装置503は、サーバー送受信部5031、音声変換部10113を有する。
【0050】
サーバー送受信部5031は、端末から音声情報、映像情報等を受信する、また、端末に音声情報、映像情報等を送信する。サーバー送受信部5031は、例えば、ネットワークカードとそのドライバーソフト等を有して実現される。
【0051】
音声変換部10113は、キャラクタ指定情報に応じて、音声情報を音声変換する。なお、音声変換する方法は、実施の形態1と同様である。音声変換部10113は、キャラクタ指定情報を端末から取得する。キャラクタ指定情報は、指定されたキャラクタに関する情報であり、例えば、「第二端末102の音声情報はキャラクタAの音声情報に変換」、「第三端末の音声情報はキャラクタBの音声情報に変換」等の情報を有する。なお、端末は、キャラクタ指定情報を予め記録していても良く、キャラクタ指定情報の入力を受け付けるキャラクタ指定入力受付手段を有するものでも良い。なお、キャラクタ指定情報は、端末から取得せず、サーバー装置503に内蔵の記録媒体に、記録しているものでも良い。
【0052】
以下、本実施の形態におけるサーバー装置503の動作について図6のフローチャートを用いて説明する。なお、第一端末501が送信する音声情報を第一音声情報、第二端末102が送信する音声情報を第二音声情報とする。
【0053】
(ステップS601)サーバー装置503は、第一端末501および第二端末102と接続する入力を受け付けたか否かを判断する。サーバー装置503が接続する入力を受け付けた場合、ステップS602に行き、受け付けない場合、ステップS601に戻る。なお、接続する入力は、サーバー装置503の電源スイッチをONにする入力、または接続スイッチをONにする入力等のものでも良く、その他の入力手段でも良い。
【0054】
(ステップS602)サーバー送受信部5031は、音声情報を受信したか否かを判断する。また、サーバー送受信部5031は、映像情報を受信したか否かを判断する。サーバー送受信部5031は、音声情報および映像情報を受信した場合、ステップS603に行き、受信しない場合、ステップS602に戻る。
【0055】
(ステップS603)音声変換部10113は、ステップS602において受信した音声情報が、第二音声情報か否かを判断する。音声変換部10113は、第二音声情報である場合、ステップS604に行き、そうでない場合、ステップS605に行く。例えば、第二音声情報か否かを判断する方法は、以下である。音声情報に伴って受信された電話番号が、第二端末102の電話番号である場合、第二音声情報であると、音声変換部10113は判断する。なお、第二端末102の電話番号等は、サーバー装置503に内蔵の記録媒体に、予め保持されている。
【0056】
(ステップS604)音声変換部10113は、第二音声情報を音声変換する。
【0057】
(ステップS605)サーバー送受信部5031は、ステップS604において音声変換した第二音声情報を第一端末501に送信する。また、サーバー送受信部5031は、第一音声情報を第二端末501に送信する。
【0058】
(ステップS606)サーバー装置503は、第一端末501および第二端末102との接続を切断する入力を受け付けたか否かを判断する。サーバー装置503は、接続を切断する入力を受け付けた場合、サーバー装置503の動作は終了し、切断する入力を受け付けない場合、ステップS602に行く。なお、切断する入力は、サーバー装置503の電源スイッチをOFFにする入力、または接続スイッチをOFFにする入力等のものでも良い。
【0059】
以上、サーバー装置503の動作を図6のフローチャートを用いて説明した。かかる説明において、第二音声情報を音声変換するものだったが、第一音声情報を音声変換するものでも良く、第一音声情報および第二音声情報を音声変換するものでも良い。
【0060】
また、第一端末501と第二端末102の動作は、以下である。第一端末501または第二端末102は、音声入力部が入力を受け付けた音声、および映像入力部が入力を受け付けた映像を、サーバー装置503に送信する。第一端末501または第二端末102は、サーバー装置503から受信した音声情報を音声出力部が出力し、またサーバー装置503から受信した映像情報を映像出力部が出力する。
【0061】
以下、本実施の形態における教育システムの具体的な動作について説明する。図7は、本実施の形態における教育システムの概念の例を示す図である。図7において、今、第一端末701は、パソコン702のモニター7021の上に設置されている。また、第一端末701は、デジタルビデオカメラ7011を有し、またマイク付きヘッドホン7012(音声入出力装置)と専用線を介して接続されている。第二端末711は、テレビ712のテレビ画面7121の上に設置されている。また、第二端末711は、デジタルビデオカメラ7111を有し、またマイク付きヘッドホン7112(音声入出力装置)と専用線を介して接続されている。第三端末721は、パソコン722のモニター7221の上に設置されている。また、第三端末721は、デジタルビデオカメラ7211を有し、またマイク付きヘッドホン7212(音声入出力装置)と専用線を介して接続されている。なお、第一端末701、第二端末711は、生徒である。また、第三端末721は、英会話の先生である。
【0062】
また、第一端末701、第二端末711、第二端末721、教育システムのサーバー装置730は、インターネットを介して接続されている。モニター7021は、第二端末711側のユーザ、および第三端末721側のユーザの映像が出力されている。またテレビ画面7121は、第一端末701側のユーザ、および第三端末721側のユーザの映像が出力されている。また、モニター7221は、第一端末701側のユーザ、および第二端末711側のユーザの映像が出力されている。
【0063】
今、第一端末701は、キャラクタ指定情報(以下、「第一キャラクタ指定情報」という)をサーバー装置730に送信する。第一キャラクタ指定情報の内容は、「第二端末711の音声情報は俳優Aの音声情報Aに変換する」、また、「第三端末721の音声情報は女優Bの音声情報Bに変換する」等である。また、第二端末711は、キャラクタ指定情報(以下、「第二キャラクタ指定情報」という)をサーバー装置730に送信する。第二キャラクタ指定情報の内容は、「第一端末701の音声情報は変換しない」、また、「第三端末721の音声情報はアナウンサーCの音声情報Cに変換する」等である。また、第三端末721は、キャラクタ指定情報(以下、「第三キャラクタ指定情報」という)をサーバー装置730に、送信する。第三キャラクタ指定情報の内容は、「第一端末701の音声情報は変換しない」、また、「第二端末711の音声情報は変換しない」等である。なお、各々のキャラクタ指定情報は、予め、各々の端末に内蔵の記録媒体に記録されている。
【0064】
第一端末701、第二端末711、第三端末721は、音声情報、映像情報をサーバー装置730に送信する。サーバー送受信部5031は、各端末からの音声情報、映像情報を受信する。
【0065】
音声変換部10113は、第一キャラクタ指定情報に基づいて、第二音声情報を俳優Aの音声情報Aに変換する。また、音声変換部10113は、第三音声情報を女優Bの音声情報Bに変換する。また、音声変換部10113は、その他のキャラクタ指定情報に応じて、音声情報を音声変換する(音声変換しない旨の情報の場合は、音声変換しない)。
【0066】
サーバー送受信部5031は、音声変換部10113が音声変換した音声情報と映像情報を各々の端末に送信する。例えば、サーバー送受信部5031は、第一端末701に、音声変換した第二音声情報、音声変換した第三音声情報、および第二映像情報、第三映像情報を送信する。
【0067】
なお、本実施の形態において、各々の端末は、音声情報等をサーバー装置730に送信するものだったが、音声変換部が音声情報を音声変換しない場合、各々の端末は、音声情報をサーバー装置730に送信せず、直接、その他の端末に送信するものでも良く、他の外部装置を経由して送信するものでも良い。
【0068】
また、本実施の形態において、各端末は、キャラクタ指定情報をサーバー装置730に送信するものだったが、サーバー装置730が、キャラクタ指定情報テーブルを有し、音声変換部が、当該キャラクタ指定情報テーブルに基づいて、音声情報を音声変換するものでも良い。以下に、キャラクタ指定情報テーブルに基づいて音声情報を音声変換する方法について、図8、9を用いて説明する。図8のテーブルは、音声変換される音声情報が指定されているデータ例を示す図である。図8のテーブルにおいて、レコード番号は、キャラクタ指定情報テーブルのレコード番号を示す。また、ユーザ識別子は、ユーザを識別する情報である。図8のテーブルにおいて、例えば、レコード番号「1」の内容は、「生徒B」で識別される端末に送信される「先生A」の音声情報が音声変換されることを表している。つまり、図8のテーブルは、現在、教育システムを利用している先生と生徒を管理するテーブルである。図9におけるキャラクタ指定情報テーブルは、レコード番号、ユーザ識別子、キャラクタ識別子、ポインタ等の情報を有するテーブルである。キャラクタ識別子は、キャラクタの音声情報を識別する情報である。ポインタは、キャラクタ識別子に応じたキャラクタの音声波形データファイルを指定するポインタである。音声波形データは、予め、サーバー装置730に内蔵の記録媒体に記録されている。図9のテーブルにおいて、例えば、レコード番号「1」の内容は、図8のテーブルにおいて指定される「先生A」の音声情報を、ポインタが指定するキャラクタ「漫画の主人公E」の音声波形に音声変換することを表している。また、音声変換された「先生A」の音声情報を、「生徒B」で識別される端末に送信することを表している。なお、音声変換する具体的方法は、実施の形態1において説明した方法と同様である。また、図9のテーブルにおいて、「ユーザ識別子」で識別される生徒が、「キャラクタ識別子」で識別される音声に、先生の音声情報が変換されることを指示した旨を示す。
【0069】
以上、本実施の形態によれば、複数の端末からの音声情報をキャラクタの音声情報に変換し、出力できる。よって、複数人を対象にするグループレッスン等の場合においても、利用者(特に、生徒)は、集中して、楽しく学習できる。
【0070】
【発明の効果】
本発明によれば、第二端末で入力された音声が、第一端末で出力される際に、キャラクタの音声で出力される。よって、利用者は、集中して学習できる。例えば、キャラクタの音声がテレビ漫画の主人公の声である場合に、利用者(特に、子供)は、集中して、楽しく学習できる。
【図面の簡単な説明】
【図1】実施の形態1における教育システムの構成を示すブロック図
【図2】実施の形態1における第一端末の動作について説明するフローチャート
【図3】実施の形態1における第二端末の動作について説明するフローチャート
【図4】実施の形態1における教育システムの概念の例を示す図
【図5】実施の形態2における教育システムの構成を示すブロック図
【図6】実施の形態2におけるサーバー装置の動作について説明するフローチャート
【図7】実施の形態2における教育システムの概念の例を示す図
【図8】実施の形態2における音声情報が指定されているデータ例を示す図
【図9】実施の形態2におけるキャラクタ指定情報テーブルの例を示す図
【符号の説明】
101、401、501、701 第一端末
102、411、711 第二端末
1011、5011 第一音声入出力装置
1012 第一映像入出力装置
1013 第一送受信部
10111 第一音声入力部
10112 第一音声出力部
10113 音声変換部
1021 第二音声入出力装置
1022 第二映像入出力装置
1023 第二送受信部
1021 第二音声入出力装置
1021 第二音声入力部
1022 第二音声出力部
10113 音声変換部
402、702、722 パソコン
4021、7021、7221 モニター
4011、7011、7211 デジタルビデオカメラ
4012、7012、7212 マイク付きヘッドホン
412、712 テレビ
4121、7121 テレビ画面
420、503、730 サーバー装置
5031 サーバー送受信部
721 第三端末[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an education system or the like having an audio input / output device and supporting education by transmitting and receiving audio information in both directions.
[0002]
[Prior art]
Conventionally, there is an education system using a video conference system. This video conference system is a system provided with functions necessary for education, such as an authentication function for authenticating a person who has valid attendance qualifications and a grouping function for dividing a plurality of students (see Patent Document 1). . For example, when conducting English conversation education using the video conference system, the system organizes students of the same level into the same group by the above-described grouping function, and the students in the group practice conversation. Be able to do it. That is, it is possible to provide students who have equivalent English conversation skills to practice conversation more effectively than students who have differences in English conversation skills, and to efficiently improve English conversation skills. Further, the present system provides that it is possible to judge whether or not a person has a valid attendance qualification and to prevent an unauthorized person from attending the course.
[0003]
[Patent Document 1]
JP 2001-224000 A (Page 1, FIG. 1, etc.)
[0004]
[Problems to be solved by the invention]
However, the education system using the video conference system has the following potential problems. The user (especially, a child) has a problem that he cannot tolerate or concentrate on the monitor screen or the sound of the speaker for a long time. This is because the user feels as if he / she is teaching from a machine without emotions, not from the person (teacher) behind the monitor screen, and as a result, the lesson becomes boring and the concentration is reduced. Also, unlike a class in which humans are in direct contact with each other, a sense of tension does not easily occur, so that the user cannot concentrate on the class and the learning effect is not improved.
[0005]
[Means for Solving the Problems]
In order to solve the above problems, the present invention has a first voice input / output device and a second voice input / output device, and provides education by transmitting and receiving voice information bidirectionally by two voice input / output devices. This is an educational system that assists in this, and performs audio conversion when audio information input from at least one audio input / output device is output to the other audio input / output device. Such a system converts the output voice and provides an environment where the user can endure or concentrate for a long time. Therefore, the user can concentrate on learning.
[0006]
Another embodiment of the present invention is an educational system in which the sound converted above is a sound of a character. With such a system, when the input voice is output on the other side, it is output as the voice of the character. For example, when the voice of the character is the voice of the hero of the manga, the user (especially a child) can concentrate and enjoy learning.
[0007]
Further, another embodiment of the present invention is an education system in which the above-mentioned voice-converted voice is a voice specified by a user. With such a system, when the input voice is output on the other side, it is output with the voice specified by the user. For example, when the voice specified by the user is the voice of an actor longing for the user, the user can concentrate and enjoy learning.
[0008]
BEST MODE FOR CARRYING OUT THE INVENTION
[0009]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that, in this embodiment, components using the same reference numerals, steps in a flowchart, and the like have the same function, and therefore, description thereof may be omitted once.
[0010]
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of the education system according to the present embodiment. The education system has a
[0011]
The first
[0012]
The first
[0013]
The
[0014]
The first
[0015]
The first
[0016]
The first transmission /
[0017]
The second
[0018]
The second
[0019]
The second
[0020]
The second
[0021]
Hereinafter, an operation of inputting audio and video and transmitting audio and video information to an external device (for example,
[0022]
(Step S201) The
[0023]
(Step S202) The first
[0024]
(Step S203) The first transmission /
[0025]
(Step S204) The
[0026]
The operation of inputting audio and video in the
[0027]
Hereinafter, an operation of receiving audio information and video information from the
[0028]
(Step S301) The
[0029]
(Step S302) The first transmission /
[0030]
(Step S303) The first
[0031]
(Step S304) The first
[0032]
(Step S305) The first
[0033]
(Step S306) The
[0034]
The operation of receiving and outputting audio information and video information in the
[0035]
Hereinafter, a specific operation of the education system (English conversation education system) according to the present embodiment will be described. FIG. 4 is a diagram illustrating an example of the concept of the education system according to the present embodiment. In FIG. 4, the
[0036]
The server 420 of the education system performs the following operation. For example, the server device 420 outputs a daily lesson content (lesson schedule), or outputs a lesson end time. In addition, the server device 420 determines access permission of the
[0037]
Hereinafter, the operation of converting the voice information into the voice of the character will be specifically described. The microphone of the headphone with
[0038]
Next, the
[0039]
A method for the user to specify the voice information of the character is, for example, a method in which the user presses a specification button (voice specification means) every time to specify the voice information of the character corresponding to the specification button. Further, the voice information of the character specified last time may be specified without specifying the voice information of the character every time.
[0040]
The
[0041]
Further, the
[0042]
Next, the headphone with
[0043]
Note that the microphone of the headphone with
[0044]
In the present embodiment, the
[0045]
Further, in the present embodiment, the
[0046]
Further, in the present embodiment, the video output unit outputs the video input from the other terminal, but in response to converting the other audio information into the audio information of the character, the video output unit Alternatively, video information of such a character may be output. Note that the video information of the character may be stored in a recording medium built in the terminal, or may be stored in a recording medium built in the server device.
[0047]
As described above, according to the present embodiment, when the voice input by the second terminal is output by the first terminal, the voice is output as the voice information of the character. For example, when the voice of the character is the voice of the hero of the TV cartoon, the user (especially a child) can concentrate and enjoy learning. Further, for example, when the voice specified by the user is the voice of an actor longing for the user, the user can concentrate and enjoy learning. Furthermore, it has been physically impossible for the same person (for example, character A) to conduct different classes at the same time. According to the present invention, the input teacher's voice can be converted into the voice of the character A. Therefore, each student can take a lesson with the voice of the character A even if the lessons are conducted simultaneously. For example, when the class A class and the class B class having different class contents are performed at the same time, the students of the classes A and B can take the class with the voice of the popular character A at the same time. Therefore, the students in the classes A and B can concentrate on the lesson, and the learning effect is improved.
[0048]
Furthermore, the operation of the education system described in the present embodiment may be realized by software, and the software may be placed on, for example, a server, and the software may be distributed by software download. Further, the software may be recorded on a recording medium such as a CD-ROM and distributed. This is the same in all other embodiments. A program when the operation in the present embodiment is realized by software is as follows. A voice information receiving step of receiving voice information input from at least one voice input / output device to the computer, a voice conversion step of voice-converting the received voice information, and a voice of outputting the voice-converted voice information This is a program for executing an information output step. It should be noted that outputting the voice-converted voice information in the voice information output step is a concept including transmitting the voice information to another voice input / output device.
[0049]
(Embodiment 2)
FIG. 5 is a block diagram illustrating a configuration of the education system according to the present embodiment. The education system includes a
[0050]
The server transmission /
[0051]
The
[0052]
Hereinafter, the operation of the
[0053]
(Step S601) The
[0054]
(Step S602) The server transmission /
[0055]
(Step S603) The
[0056]
(Step S604) The
[0057]
(Step S605) The server transmission /
[0058]
(Step S606) The
[0059]
The operation of the
[0060]
The operations of the
[0061]
Hereinafter, a specific operation of the education system according to the present embodiment will be described. FIG. 7 is a diagram illustrating an example of the concept of the education system according to the present embodiment. In FIG. 7, the
[0062]
In addition, the
[0063]
Now, the
[0064]
The
[0065]
The
[0066]
The server transmission /
[0067]
In the present embodiment, each terminal transmits voice information and the like to the
[0068]
Further, in the present embodiment, each terminal transmits character designation information to
[0069]
As described above, according to the present embodiment, voice information from a plurality of terminals can be converted into voice information of a character and output. Therefore, even in the case of a group lesson for a plurality of people, the user (especially a student) can concentrate and enjoy learning.
[0070]
【The invention's effect】
According to the present invention, when the voice input at the second terminal is output at the first terminal, the voice is output as the voice of the character. Therefore, the user can concentrate on learning. For example, when the voice of the character is the voice of the hero of the TV cartoon, the user (especially a child) can concentrate and enjoy learning.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an education system according to a first embodiment.
FIG. 2 is a flowchart illustrating an operation of a first terminal according to the first embodiment.
FIG. 3 is a flowchart illustrating an operation of a second terminal according to the first embodiment.
FIG. 4 is a diagram showing an example of a concept of an education system according to the first embodiment.
FIG. 5 is a block diagram illustrating a configuration of an education system according to the second embodiment.
FIG. 6 is a flowchart illustrating an operation of a server device according to the second embodiment.
FIG. 7 is a diagram showing an example of a concept of an education system according to the second embodiment.
FIG. 8 is a diagram showing an example of data in which audio information is specified in the second embodiment.
FIG. 9 is a diagram showing an example of a character designation information table according to the second embodiment.
[Explanation of symbols]
101, 401, 501, 701 First terminal
102, 411, 711 Second terminal
1011, 5011 First audio input / output device
1012 First video input / output device
1013 First transceiver
10111 First voice input unit
10112 First audio output unit
10113 Voice conversion unit
1021 second audio input / output device
1022 Second video input / output device
1023 Second transceiver
1021 second audio input / output device
1021 Second voice input unit
1022 Second audio output unit
10113 Voice conversion unit
402, 702, 722 PC
4021, 7021, 7221 monitor
4011, 7011, 7211 Digital video camera
4012, 7012, 7212 Headphones with Microphone
412, 712 TV
4121, 7121 TV screen
420, 503, 730 server device
5031 Server transceiver
721 Third terminal
Claims (10)
前記二つの音声入出力装置により双方向に音声情報を送受信することにより教育を行うことを支援する教育システムであって、
少なくとも一方の音声入出力装置から入力された音声情報を他方の音声入出力装置に出力する場合に、音声変換された音声情報を出力する教育システム。Having a first voice input / output device and a second voice input / output device,
An education system that supports education by transmitting and receiving audio information in two directions by the two audio input / output devices,
An education system that outputs voice-converted voice information when voice information input from at least one voice input / output device is output to the other voice input / output device.
前記他方の音声入出力装置のユーザにより指定された音声情報への変換である請求項1または請求項2いずれか記載の教育システム。The voice conversion is
3. The educational system according to claim 1, wherein the conversion is to conversion to voice information specified by a user of the other voice input / output device.
第一音声入出力装置または/および第二音声入出力装置が音声情報を音声変換する請求項1から請求項3いずれか記載の教育システム。The voice conversion is
The educational system according to any one of claims 1 to 3, wherein the first voice input / output device and / or the second voice input / output device converts voice information into voice.
前記サーバー装置は、
少なくとも一方の音声入出力装置が送信した音声情報を音声変換する請求項1から請求項3いずれか記載の教育システム。The educational system includes a server device that receives voice information from at least one voice input / output device and transmits the voice information to the other voice input / output device,
The server device includes:
The educational system according to any one of claims 1 to 3, wherein voice information transmitted from at least one voice input / output device is converted into voice.
少なくとも一方の音声入出力装置から送信された音声情報を受信し、当該音声情報を音声変換し、当該音声変換した音声情報を出力する音声入出力装置。An audio input / output device constituting an education system having two audio input / output devices,
An audio input / output device that receives audio information transmitted from at least one audio input / output device, converts the audio information into audio, and outputs the converted audio information.
少なくとも一方の音声入出力装置から入力された音声情報を受信する音声情報受信ステップと、
当該受信した音声情報を音声変換する音声変換ステップと、
当該音声変換された音声情報を出力する音声情報出力ステップを実行させるためのプログラム。On the computer,
Voice information receiving step of receiving voice information input from at least one voice input / output device,
A voice conversion step of voice-converting the received voice information;
A program for executing a voice information output step of outputting the voice information after the voice conversion.
少なくとも一方の音声入出力装置から入力された音声情報を他方の音声入出力装置に出力する場合に、音声変換を行った音声情報を出力する音声出力方法。An audio output method in an education system having a first audio input / output device and a second audio input / output device, and supporting education by transmitting and receiving audio information in two directions by the two audio input / output devices. hand,
An audio output method for outputting audio information subjected to audio conversion when audio information input from at least one audio input / output device is output to the other audio input / output device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003145718A JP2004347906A (en) | 2003-05-23 | 2003-05-23 | Educational system and speech input/output apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003145718A JP2004347906A (en) | 2003-05-23 | 2003-05-23 | Educational system and speech input/output apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004347906A true JP2004347906A (en) | 2004-12-09 |
Family
ID=33532780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003145718A Withdrawn JP2004347906A (en) | 2003-05-23 | 2003-05-23 | Educational system and speech input/output apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004347906A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076048A (en) * | 2009-10-01 | 2011-04-14 | Nobuyoshi Yamagishi | Learning device with entertainment property using voice actor or the like |
JP2015026057A (en) * | 2013-07-29 | 2015-02-05 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | Interactive character based foreign language learning device and method |
CN107707974A (en) * | 2017-09-18 | 2018-02-16 | 广东九联科技股份有限公司 | A kind of realization method and system of special efficacy voice function |
CN113823281A (en) * | 2020-11-24 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | Voice signal processing method, device, medium and electronic equipment |
-
2003
- 2003-05-23 JP JP2003145718A patent/JP2004347906A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076048A (en) * | 2009-10-01 | 2011-04-14 | Nobuyoshi Yamagishi | Learning device with entertainment property using voice actor or the like |
JP2015026057A (en) * | 2013-07-29 | 2015-02-05 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | Interactive character based foreign language learning device and method |
CN107707974A (en) * | 2017-09-18 | 2018-02-16 | 广东九联科技股份有限公司 | A kind of realization method and system of special efficacy voice function |
CN113823281A (en) * | 2020-11-24 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | Voice signal processing method, device, medium and electronic equipment |
CN113823281B (en) * | 2020-11-24 | 2024-04-05 | 北京沃东天骏信息技术有限公司 | Voice signal processing method, device, medium and electronic equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9106790B2 (en) | VoIP music conferencing system | |
CN104301657B (en) | A kind of video conference terminal and its secondary flow data cut-in method | |
TW589848B (en) | Personal computer classroom system using video phone | |
WO2001009785A1 (en) | Study method and apparatus using digital audio and caption data | |
US8553855B2 (en) | Conference support apparatus and conference support method | |
US7122731B2 (en) | Musical information processing terminal, control method therefor, and program for implementing the method | |
JP2004347906A (en) | Educational system and speech input/output apparatus | |
Rimell et al. | The influence of cross-modal interaction on audio-visual speech quality perception | |
JP2001224000A (en) | Multi-spots tv conference system | |
JP3348831B2 (en) | Text-based voice communication system, communication server device, and communication display device | |
CN102263929A (en) | Conference video information real-time publishing system and corresponding devices | |
JP2003339034A (en) | Network conference system, network conference method, and network conference program | |
RU42905U1 (en) | EMOTION DETECTION SYSTEM | |
JP2008028884A (en) | Call center system for tv telephone communication | |
JP5424359B2 (en) | Understanding support system, support terminal, understanding support method and program | |
JP5777233B1 (en) | Movie generation apparatus and movie generation method | |
Rimell et al. | The influence of content, task and sensory interaction on multimedia quality perception | |
CN113938553B (en) | Audio equipment and sound effect adjusting method thereof | |
CN113096674B (en) | Audio processing method and device and electronic equipment | |
KR20040039603A (en) | System and method for providing ringback tone | |
WO2023162119A1 (en) | Information processing terminal, information processing method, and information processing program | |
RU2137301C1 (en) | Method for individual-to-virtual-image communications | |
JP2005266337A (en) | Network music teaching system and server device | |
KR20010105110A (en) | Remote education system | |
JP2005107320A (en) | Data generator for voice reproduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060519 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060613 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070730 |