JP2012215645A - コンピュータを利用した外国語会話練習システム - Google Patents
コンピュータを利用した外国語会話練習システム Download PDFInfo
- Publication number
- JP2012215645A JP2012215645A JP2011079454A JP2011079454A JP2012215645A JP 2012215645 A JP2012215645 A JP 2012215645A JP 2011079454 A JP2011079454 A JP 2011079454A JP 2011079454 A JP2011079454 A JP 2011079454A JP 2012215645 A JP2012215645 A JP 2012215645A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- sentence
- input
- response sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000004044 response Effects 0.000 claims abstract description 105
- 230000013016 learning Effects 0.000 claims abstract description 65
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 35
- 238000004891 communication Methods 0.000 claims abstract description 19
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 15
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 241000272201 Columbiformes Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008921 facial expression Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000271566 Aves Species 0.000 description 1
- 241000272184 Falconiformes Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000287127 Passeridae Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000035045 associative learning Effects 0.000 description 1
- 239000000571 coke Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 1
- JZCCFEFSEZPSOG-UHFFFAOYSA-L copper(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Cu+2].[O-]S([O-])(=O)=O JZCCFEFSEZPSOG-UHFFFAOYSA-L 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013550 pizza Nutrition 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】直接教師との対話による学習システムに近い、内容が固定されない会話を自己学習により、安価に実現すること。並びに、学習時間が限定されない外国語会話の練習システムを実現すること。
【解決手段】サーバーコンピュータとクライアントコンピュータとが通信回線を介して接続されたサーバークライアントシステムにおいて、話者の音声データを文字情報である入力文に変換する音声認識部と、特性値テーブルの値に基づき応答文を生成する人工知能部と、応答文を音素データに変換する音声合成部とを備えたコンピュータを利用した外国語会話練習システム。
【選択図】 図1
【解決手段】サーバーコンピュータとクライアントコンピュータとが通信回線を介して接続されたサーバークライアントシステムにおいて、話者の音声データを文字情報である入力文に変換する音声認識部と、特性値テーブルの値に基づき応答文を生成する人工知能部と、応答文を音素データに変換する音声合成部とを備えたコンピュータを利用した外国語会話練習システム。
【選択図】 図1
Description
本発明は、コンピュータを利用した外国語の学習システムであって、詳しくは、音声による応答をベースとした外国語の学習システムに関する。
コンピュータを用いて外国語の学習を支援する技術がある。例えば、特許文献1には、装置主導で外国語会話学習を進行させ、該外国語会話学習に最適な環境を学習者に提供する学習指導装置が記載されている。
特許文献1の技術は、第1のプロセッサを有し、かつ、主として学習用教材の提供及び学習の進捗管理を行う学習指導部Aと、該第1のプロセッサとは独立に駆動可能な第2のプロセッサを有し、かつ、主として指導対象である学習者に対する学習の進行を音声により行うインターフェース部から構成され、前記学習指導部は、前記インターフェース部が前記学習者に対して音声により行っている学習指導動作と並行して、その後行われる学習指導に先立ち、該後の学習指導に必要な学習関連情報を前記第1および第2の入出力手段を介して該インターフェース部に予め出力するよう、該学習関連情報の入出力管理を行うことを特徴としている。
特許文献2には、英会話などの学習を援助する学習検定装置が記載されている。特許文献2の技術は、英会話学習検定装置は、問題を出力すると、この問題文に対する正解文を構成する単語とこの単語と関連性を有する単語とから、正解候補単語群を作り、これらの単語をソートした上で、単語カードの形態でCRT上に表示する。使用者は、マウスを操作してこの単語カードを選択することにより、解答を入力する。また、キーボードから1文字入力するたびに該当する単語カードを絞り込んで、解答文を入力することができる。
特許文献3には、 自分のペースで且つ場所を選ばずに外国語の発音及び聞き取りの練習ができる外国語学習方法が記載されている。特許文献3の技術は、外国語単語データ及び外国語文章データが格納された外国語の供給者側端末と、音声を出力可能な学習者側端末とがインターネットを介して接続され、供給者が供給者側端末を介してインターネット上に外国語学習のホームページを開設しており、学習者側端末がホームページにアクセスすることにより、学習者側端末が、供給者側端末から送信された外国語単語データ又は外国語文章データに基づく音声を出力する。
特許文献4には、外国語の発音を学習する学習者を支援する技術が記載されている。特許文献4の技術は、発音評価サービスにおいては、各生徒が生徒端末から自らの音声情報をDSPサーバー装置へ送信すると、その音声情報を基に特定した習熟レベルがDSPサーバー装置へ蓄積される。練習相手紹介サービスにおいては、DSPサーバー装置が、同じ習熟レベルの生徒端末同士をマッチングし、それら両端末間での音声情報のやり取りを制御する。
コンピュータを利用した外国語学習システムにおいて、教師なしの自己学習を中心としたシステムや、教師が存在する対話型システムがある。前者においては、リスニングとこれに応答する会話を録音再生して学習を図るシステムや、シャドーイングを行なわせるシステムがある。後者においては、直接又は通信回線を介して教師が対応するシステムとなっている。
自己学習システムは、安価である半面、学習が独りよがりとなり、発音の矯正や生きた会話の習得が難しく、学習効果の点で難点がある。一方、対話型学習システムは、生徒が学習している間教師が時間的に拘束され、一人の教師が一度に学習できる人数が少数に限られ、結果として、対話型学習システムは高価となり、学習できる時間も制限を受ける。
また、自己学習システムにおいても、近年、生徒の会話に応答してインタラクティブに応答する学習システムが見受けられるようになってきている。しかし、自己学習システムと対話型学習システムを折衷したこのような学習システムにおいては、費用が比較的安価である反面、会話内容が固定されており、自由な会話でないため、本体の意味での会話の練習にはなっていない。
更には、従来の学習システムはリスニングの学習効果はある程度期待できるが発音の学習を効果的行うことができない。会話は、聞くことと喋ることによって成り立っている以上、発音やイントネーションの訓練が重要であるところ、生徒の発音の練習は、教師との直接指導によってなされことが好ましく、また、効果的でもある。このため発音やイントネーションの学習が高価で、時間的にも制限の多いものとなっている。
また、外国語の会話の学習においては、スムーズな意思の疎通の学習が重要であるところ、従来の学習システムにおいては、リスニングとそれに対する応答を中心としたものであり、会話の内容が固定されており、学習を進めることによる習熟が期待できない。
本発明は、上記課題を解決するためになされたものであり、直接教師との対話による学習システムに近い、内容が固定されない自由な会話を自己学習により、安価に実現するものであり、時間の制約を受けず都合のよい時間に学習ができる外国語会話練習システムを提供する。
前記した目的を達成するために、本発明に係るコンピュータを利用した外国語会話練習システムは、サーバーコンピュータとクライアントコンピュータとが通信回線を介して接続されたサーバークライアントシステムにおいて、
前記クライアントコンピュータには、音声認識部と音声再生部と表示部とを含んでいて、前記サーバーコンピュータには、人工知能部と音声合成部とを含んでいて、前記音声認識部は、話者の音声を電気信号に変換するマイクと、当該マイクからの電気信号を音声データに変換する音声入力部と、当該音声入力部からの音声データを文字情報である入力文に変換する音声分析部とを含んでいて、前記人工知能部は、前記話者に対する応答者を模擬して応答文を生成する部分であって、当該応答者の特性を記述した特性値テーブルを有していて、前記音声認識部から前記通信回線を介して入力された入力文から前記特性値テーブルに基づき応答文を自動的に生成する応答文生成部とを有していて、前記音声合成部は、前記応答文生成部で生成された応答文を音素データに変換する文字音素変換部を含み、前記音声再生部は、前記音声合成部から前記通信回線を介して送信される音素データを可聴音声に変換して出力し、前記表示装置は、音声認識部からの入力文および前記応答文生成部からの応答文を表示してなる。
前記クライアントコンピュータには、音声認識部と音声再生部と表示部とを含んでいて、前記サーバーコンピュータには、人工知能部と音声合成部とを含んでいて、前記音声認識部は、話者の音声を電気信号に変換するマイクと、当該マイクからの電気信号を音声データに変換する音声入力部と、当該音声入力部からの音声データを文字情報である入力文に変換する音声分析部とを含んでいて、前記人工知能部は、前記話者に対する応答者を模擬して応答文を生成する部分であって、当該応答者の特性を記述した特性値テーブルを有していて、前記音声認識部から前記通信回線を介して入力された入力文から前記特性値テーブルに基づき応答文を自動的に生成する応答文生成部とを有していて、前記音声合成部は、前記応答文生成部で生成された応答文を音素データに変換する文字音素変換部を含み、前記音声再生部は、前記音声合成部から前記通信回線を介して送信される音素データを可聴音声に変換して出力し、前記表示装置は、音声認識部からの入力文および前記応答文生成部からの応答文を表示してなる。
この構成によれば、インターネットを介して接続されたサーバーコンピュータ(以下、サーバーと称す)とクライアントコンピュータ(以下、クライアントと称す)が協働して外国語会話の練習システムを構築してなる。話者である生徒はクライアントに接続されたマイクに向かって喋り、その内容は入力文として文字情報に変換される。ここにいう入力文は人工知能部に対する入力という意味である。話者である生徒からの入力文に応答して、もしくはあらかじめ定められた手順に応じて、サーバーが応答者となり生徒との会話を行う。したがって、自動的に応答文を生成するとは人手を介さずにプログラムにより応答文を生成するという意味である。
人工知能部はサーバーに内蔵されたプログラム実行することにより機能する。当該人工知能部は、サーバー上に擬人化した応答者(以下、教師もしくはロボットと称することがある)であり、生徒の入力文に応答したり、生徒との間で適宜質問を発したりすることにより会話を進める。人工知能部の記憶装置には、応答者の特性を記載した特性値テーブルがデータベースとして収納されている。つまり特性値テーブルは、応答者に付随したデータといえる。
応答者の応答内容は、生徒の入力文とこの特性値テーブルにより、応答文生成部で生成される。もっとも、応答者が会話のきっかけを作って会話を進める形式においては、応答者はあらかじめ定められた手順により質問を発することとなる。
なお、以下、サーバーコンピュータはサーバーパソコンとクライアントコンピュータはユーザーパソコンと称されることもある。
(CL2)本発明に係るコンピュータを利用した外国語会話練習システムは、前記応答文生成部において、応答文の候補であるテンプレートが会話の分野を定めるカテゴリー毎に用意されていて、前記カテゴリーの選定が前記入力文に含まれるキーワードによりなされることが好ましい。
この構成によれば、応答者の応答内容は、テンプレートとしてあらかじめ用意されていて、このテンプレートは応答内容の共通性に基づきカテゴリー毎に分類されている。このような2層構造を有しているので、適切な応答文の生成がスムーズに行うことが可能となる。カテゴリーの選定は入力文に含まれるキーワードによりなされ、キーワードは人工知能部のデータベースとして記憶装置に収納されている。
(CL3)本発明に係るコンピュータを利用した外国語会話練習システムは、前記テンプレートには変数を有するものが含まれていて、当該変数の値が前記特性値テーブルから求められてなることが好ましい。
この構成によれば、テンプレートには変数が含まれていてもよく、その変数の取りうる値が特性値テーブルに基づき定められてもよい。テンプレートは応答文もしくは応答文と変数により構成されていてもよい。
(CL4)本発明に係るコンピュータを利用した外国語会話練習システムは、前記特性値テーブルが複数あり、当該特性値テーブルが前記クライアントコンピュータにおいて選択可能になっていることが好ましい。
この構成によれば、サーバー上において擬人化された応答者は複数存在していてもよい。応答者をクライアントにおいて選択することにより、応答文生成部において用いられる特性値テーブルが定まることとなるので、応答文の内容が特性値テーブルの特性値に応じて異なることとなる。
(CL5)本発明に係るコンピュータを利用した外国語会話練習システムは、前記話者との応答に基づき、特性値テーブルもしくはテンプレートの内容が追加修正されてなることが好ましい。
この構成によれば、話者の入力文を新たにテンプレートとして追加したり、入力文に応じて特性値テーブルの内容を修正もしくは追加する。
この構成によれば、話者の入力文を新たにテンプレートとして追加したり、入力文に応じて特性値テーブルの内容を修正もしくは追加する。
(CL6)本発明に係るコンピュータを利用した外国語会話練習システムは、前記表示装置には、応答文の音声出力に合わせて表情が変化するアバターが表示されることが好ましい。
この構成によれば、アバターはウエブ上で自分の分身となるキャラクターであって、視覚的に応答者を表現する。アバターは音声出力に合わせて口が動くが、目やその他の表情が変化してもよい。アバターは画像情報として人工知能部のデータベースに収納されていてもよい。
(CL7)本発明に係るコンピュータを利用した外国語会話練習システムは、学習の内容が複数用意されていて、いずれの学習内容を選定するかが前記クライアントコンピュータにおいて選択可能であることが好ましい。
この構成によれば、会話練習の他、リスニング練習、発音練習または単語ビルダーもしくはフレーズビルダーの練習を行うことができる。
(CL8)本発明に係るコンピュータを利用した外国語会話練習システムは、システムに対する指示入力がマウスやキーボードの他、前記マイクを通じた音声により行えることが好ましい。
この構成によれば、学習の繰り返しや終了のみならず、音声入力のやり直しをキーボード等を使用せずに直接音声により行うことができる。
(CL9)本発明に係るコンピュータを利用した外国語会話練習システムを収納した記録媒体は、音声認識部と、音声再生部と、表示部と、人工知能部と、音声合成部とを含んでいて、前記音声認識部は、前記話者の音声を電気信号に変換するマイクと、当該マイクからの電気信号を音声データに変換する音声入力部と、当該音声入力部からの音声データを文字情報である入力文に変換する音声分析部とを含んでいて、前記人工知能部は、前記話者に対する応答者を模擬して応答文を生成する部分であって、当該応答者の特性を記述した特性値テーブルを有していて、前記音声認識部から前記通信回線を介して入力された入力文から前記特性値テーブルに基づき応答文を自動的に生成する応答文生成部とを有していて、かつ、前記応答文生成部において、応答文の候補であるテンプレートが会話の分野を定めるカテゴリー毎に用意されていて、前記カテゴリーの選定が前記入力文に含まれるキーワードによりなされ、かつ、前記テンプレートには変数を有するものが含まれていて、当該変数の値が前記特性値テーブルから求められてなり、かつ、前記特性値テーブルが複数あり、当該特性値テーブルが前記クライアントコンピュータにおいて選択可能になっていて、前記話者との応答に基づき、特性値テーブルもしくはテンプレートの内容が追加修正されてなり、前記音声合成部は、前記応答文生成部で生成された応答文を音素データに変換する音声変換部を含み、前記音声再生部は、前記音声合成部からの音素データを音声発生器から可聴音声信号として出力して、前記表示装置は、音声認識部からの入力文および前記応答文生成部からの応答文を表示してなる。
本発明は、上記解決手段により、直接教師との対話による学習システムに近い、内容が固定されない自由な会話を自己学習より、安価に実現するものであり、学習時間に制約を受けない外国語会話練習システムを提供する。
以下、本発明に係る実施形態を図面に従って英会話を例に取り説明するが、本発明はこの実施形態に限定されるものではなく、他の外国語であってもよく、また、母国語は日本語以外の言語であってもよい。
図1は、本発明の実施の形態に係る外国語会話練習システム1の構成例を示すブロック図である。外国語会話練習システム1は、大別してユーザーパソコン2とサーバーパソコン3とから構成されている。ユーザーパソコン2は、マイク10、表示装置11、スピーカー12、再生部17および音声認識部6とを有している。サーバーパソコン3は、人工知能部7と音声合成部8とから構成される。そして、ユーザーパソコン2とサーバーパソコン3とは通信回線4を介して接続されている。
ユーザーパソコン2において、マイク10とスピーカー12の代わりに、これらを一体化したヘッドセットを用いることができる。また、図示しないマウスやキーボードなどの入力装置を備えている。ユーザーパソコン2とサーバーパソコン3とは通信回線4を介してインターネットを利用してWEB接続されている。
音声認識部6は、音声入力部13、音声識別部14、入力文出力部15および記憶装置16とを備えている。音声認識部6は、マイク10を通して入力された音声信号をコンピュータで解析して、発話内容を文字データに変換する音声認識処理を司る。
音声認識部6の音声入力部13は、マイク10から入力された音声のアナログ信号に対して微小な時間単位ごとにサンプリングを行い、アナログ・デジタル変換して波形振幅の時間系列のデジタル信号に変換処理を行い次段の音声分析部14に送る。なお、マイク10から入力された音声信号はWAVファイルに変換されて記憶装置16に保存される。保存(録音)したWAVファイルは適宜再生をすることにより、学習の確認や復習に役立たせることが可能となる。
音声分析部14における処理は、大別して音響モデルと、単語辞書、言語モデルで構成されていている。音響モデルは、音声入力部13が出力したデジタル音声信号を入力として、デジタル音声信号をFFT(高速フーリエ変換)分析を適用することによって音素の周波数の時間変化を分析し、発声された音素の特徴データを抽出する。続いて、認識結果などと対応付けた形で予め辞書として用意している音素の標準パターンまたはその系列と、抽出した特徴データとを、HMM(隠れマルコフモデル)手法を用いて比較照合し、発声内容の認識候補を生成する。言語モデルは、日本語の文章であるという制約を表す確率モデルであって、次に発声されうる単語を予測して、最も確からしさを表す尤度に基づき候補を推定選択することによって、発声内容を認識する。手法としては、単語Nグラムとして知られたモデルを使用する。具体的には単語3グラムが用いられている。
単語辞書は、各単語もしくはフレーズの読みを音素の特徴データとして定義しており、データベースとして記憶装置16に収納されている。単語辞書の作成に当っては、男女30人の日本人がそれぞれ8時間かけて録音した「日本人発音モデル」をベースに、日本人特有の発音(音素の組み合わせ)を認識できるようにしており、単語数は習得レベルに応じて初級者用は1200語、中級者用は4400語、上級者用は12000語とした。
入力文出力部15は、音声分析部14で処理された発話内容を文字情報(入力文)として受け取り、これを通信回線4を介してサーバーパソコン3に出力する。更に、表示装置11に入力文を表示可能にする。これにより、外国語会話練習システム1を使用する話者(生徒)は、自分が話した言葉がシステムに正常に認識されたか否かを確認することが可能となる。
人工知能部7は、入力文入力部20、入力文解析部21、応答文生成部22および記憶装置23とを備えている。入力文入力部20は、ユーザーパソコン2から送られてきた話者の会話内容を文字情報(入力文)として受取り次段の入力文解析部21に送る。
入力文解析部21は、入力文に含まれるキーワードを検索して、キーワードに基づき会話内容のカテゴリーを決定する。キーワードは、人工知能データベースとして記憶装置23にキーワードテーブルとして保存されていて、各キーワードはその属性としてカテゴリーの情報(具体的にはカテゴリーコード)を有している。
入力文、キーワードおよびカテゴリーコードは応答文生成部22に送られて、応答文が生成される。応答文は、話者(生徒)に対する会話の相手であってコンピュータ上で擬人化された応答者(教師)の発話内容を表す。応答文生成部22では、送られてきたカテゴリーコードを元に、当該カテゴリーに属するテンプレートを選定して応答文を生成する。このとき選定されたテンプレートに変数がある場合は、当該変数の値を記憶装置23にデーターベースとして収納されている特性値テーブル35からその変数に対応する値を取り出して、テンプレートに代入して応答文を完成させる。
人工知能部7で生成された応答文は音声合成部8に送られて、音声信号に変換されて通信回線4を介してユーザーパソコン2に送られる。すなわち、応答文は応答文入力部24を介して文字音素変換部25に送られて、応答文の文字単位で音素データに変換される。そして、文字音素変換部25において文字音素変換された応答文は、音声出力部27においてデジタル音声信号に変換されて、セグメントに分割されて、通信回線4を介してユーザーパソコン2に送られる。音声信号を送る代わりに、mp3形式のファイルに変換してユーザーパソコン2でダウンロード可能としてもよい。
サーバーパソコン3からの音声信号は、ユーザーパソコン2の再生部17でインピーダンス変換されてスピーカー12から音声出力される。なお、mp3形式等の符号化された形式で音声信号が送られてくる場合は、再生部17で変換処理される。
また、応答文は表示装置11に文字情報として表示してもよく、この場合は、図示が省略されているが、応答文生成部22で生成された応答文は、通信回線4を介して表示装置11に送られる。
本発明の実施の形態に係る外国語会話練習システム1において、その処理を図2に示すフローチャートにより説明する。
ステップ1(S1)において、ユーザーである話者の発話の有無が判断される。発話がある場合は、ステップ2(S2)に移行し、発話がない場合はステップ9(S9)にて一定時間以上発話がないかどうか判断され、ステップ5(S5)に移行する。
ステップ2(S2)において、ユーザーの発話内容を音声認識部6の音声入力部13にて音声データに変換する。
ステップ3(S3)において、音声データを文字情報(テキスト)に変換して音声認識結果を入力文として出力する。
ステップ4(S4)において、入力文の構造を文法的に構文解析する。
ステップ5(S5)において、パターンマッチングにより条件を満たすテンプレートをテンプレートマッチングにより選択する。
ステップ6(S6)において、選択された規則によって応答文(テキスト)を生成する。
ステップ7(S7)において、応答文を音声データに変換して、スピーカー12を通じて出力する。
ユーザーが終了を指示しないのであればステップ2(S2)に戻る。
なお、ステップ9(S9)において、ユーザーが一定時間以上発話がない場合は、ステップ5(S5)において、ユーザーに対する質問となる規則を選択する。この場合は、ステップ6(S6)において、ユーザーに対する質問と応答文が生成される。一般に外国語の学習において、ユーザーである生徒は往々にして返答に窮することがある。このような場合でも、会話を中断させることなく、学習を進めることを可能にしている。また、会話をサーバーの応答者(教師)から始めたい場合は、ステップ9(S9)のような処理工程を設けることは学習の効果から好ましい。
生徒(ユーザー)と教師(サーバー)の会話のパターンの一例を図3に示す。図3(a)は、教師が質問を出し、それに生徒が応答して、生徒の質問にたいして教師が応答する典型的な生徒と教師の会話パターンである。すなわち、
教師(ここではIsabelle)が、先ず、質問を出す。
(S111) Isabelle: What is one of your bad habits?
(S111) Isabelle: What is one of your bad habits?
これに対して生徒(ここではHuman)が応答すると共に教師に対して質問をする。
(S112) Human: I have no bad habits. Do you have bad habits?
(S112) Human: I have no bad habits. Do you have bad habits?
生徒の応答に対して教師が応答した後、生徒の質問に対して回答をする。教師の応答は2つの文からなっている。
(S113) Isabelle: Why not? No, I don’t think I have any bad habits.
(S113) Isabelle: Why not? No, I don’t think I have any bad habits.
教師の応答に対して、生徒が応答しない場合がある。
Human: ( no reply )
Human: ( no reply )
一定時間以上、生徒からの応答(発話)がなければ、会話を継続するために教師の方から生徒に対して質問をする。
(S113) Isabelle: What drink goes well with pizza?
(S113) Isabelle: What drink goes well with pizza?
教師の質問に対して、生徒が応答する。
(S114) Human: coke does.
(S114) Human: coke does.
図3(b)は、生徒が質問を出して会話が始まるケースの会話パターンである。すなわち、生徒が教師に質問をする。
(S121) Human: What is your name?
(S121) Human: What is your name?
これに対して教師が応答を返す。
(S122) Isabelle: My name is Isabelle.
(S122) Isabelle: My name is Isabelle.
教師の応答に対して、生徒は更に質問を続ける。
(S123) Human: How old are you?
(S123) Human: How old are you?
生徒の質問に対して、教師が応答する。
(S124) Isabelle: I’m 28 years old.
(S124) Isabelle: I’m 28 years old.
ここで生徒は教師の名前や年齢を尋ねているが、教師の応答文生成に際しては、その教師(ここではIsabelle)の特性値テーブル35を参照して、その名前や年齢を求める。したがって、会話の相手となる教師が異なれば、異なった応答文が生成されることとなる。
図3(c)は、生徒が質問を出して会話が始まる別のケースの会話パターンである。すなわち、
生徒が教師に質問をする。
(S131) Human: Are you single?
図3(c)は、生徒が質問を出して会話が始まる別のケースの会話パターンである。すなわち、
生徒が教師に質問をする。
(S131) Human: Are you single?
これに対して教師が応答を返す。
(S132) Isabelle: Yea, I am single at the moment.
Human: ( no reply )
(S132) Isabelle: Yea, I am single at the moment.
Human: ( no reply )
一定時間以上、生徒からの応答(発話)がなければ、会話を継続するために教師の方から生徒に対して質問をする。
(S132) Isabelle: When was the last time you ate at a family restaurant?
(S132) Isabelle: When was the last time you ate at a family restaurant?
これに対して生徒が応答を返し、その後に質問を出す。
(S133) Human: It was two days ago. Do you often go out to eat?
(S133) Human: It was two days ago. Do you often go out to eat?
生徒の質問に対して教師が応答を返す。
(S134) Isabelle: Right. I suppose it was. I spend all my time at work, home or with my friends.
(S134) Isabelle: Right. I suppose it was. I spend all my time at work, home or with my friends.
サーバーパソコン3の人工知能部7におけるファイル構造を図4を用いて説明する。人工知能部7にはカテゴリーファイル31、単語ファイル32および文法ファイル33から構成されるマッチングファイル30がデータベースとして記憶装置23に格納されていて、データが必要なときはその都度記憶装置23からメインメモリ(図示せず)に読み出されて処理される。
カテゴリーファイル31には、食べ物、スポーツ、音楽、日本、旅行、映画等の会話のジャンル別にカテゴリーがカテゴリーコードと共に設けられている。そして、カテゴリーファイル31には、応答文の生成のベースとなるテンプレートが保存されていて、会話のカテゴリーが定まれば、カテゴリーファイル31のテンプレートを基にして応答文が生成される。
会話のカテゴリーにおいて特徴的なキーワードとなる単語はキーワード、カテゴリーファイル31に付属するテーブルの形で記憶装置23に格納されている。
また、カテゴリーファイル31にはこれにリンクするかたちで単語ファイル32が設けられており、カテゴリー毎に使用される単語およびフレーズが単語ファイル32に収納されている。
文法ファイル33は、入力文の構文解析を行うときに用いられ、カテゴリーに依存しない汎用性のあるテンプレートから成り立っている。
話者の入力文が受取ると応答文生成部22は、入力文に含まれるキーワードをパターンマッチングにより探して、キーワードに対応するカテゴリーを選定する。同時に構文解析により文法ファイル33から、入力文に対応したテンプレートを選定する。複数のテンプレートの候補が見つかれば、最初に該当したテンプレートを用いて応答文を生成する。
図5は応答者(教師)の特性を記述する特性値テーブル35の構造と記載例を示す表である。応答者(教師)はロボットと称することもある。すなわちユーザーである生徒はコンピュータの中に実現された英会話ロボットと話すことになり、この英会話ロボットが人工知能を有しているということができる。
ロボット(応答者)は複数いて、どのロボットと会話をするかはユーザー(生徒)が自由に選ぶことができる。図5に示すようにロボットはコード番号でシステム上識別されており、一方、生徒とのインターフェースはニックネームもしくは氏名を用いる。また担当分野の欄には、そのロボットの機能(守備範囲)が記述されていて、生徒が学習を始める際のロボットの選定に資することができる。図5の項目の欄は例示であり図5に示したもの以外のもの、例えば、家族の有無やペットの名前等があってもよい。生徒との会話を通じて、項目を増やしてもよい。特性値テーブル35はデータベースとして記憶装置23に収納されている。
ユーザーパソコン2において本発明の実施形態に係る外国語会話練習システム1を立ち上げたとき、表示装置11にメニュー選択画面が表示される。メニュー選択画面を図6に示す。生徒はメニュー画面に表示されたメニューをマウスでクリックして選択することにより、希望した学習に進むことができる。すなわち、
(1)単語ビルダー;会話のための必須単語1200語に加え、中級、上級まで、合計4000語が収録されており、会話を円滑にするための単語・熟語ドリルが1500問題収録されている。
(2)発音練習;音声認識機能を使って発音練習をすることにより、生徒の発音が適正かどうか判断できるツールを提供する。日本人の発音はそれほど悪くないが、日本人の悪い癖は、子音に母音を添えてしまうこと、すなわち、カタカナ読みをしてしまうことである。発音は、音の位置や口の形で学べるものではなく、それはあくまでも結果論であって、要するに正しい音が出ればいいのである。発音練習を行うことによりロボットとの会話はよりスムーズにすることができるようになる。
(3)会話レッスン;会話の実践をロボットたちがする。ここで、会話の仕方を習います。初級、中級、上級、各15レッスンが収録されている。
(4)リスニングドリル;聞き取りも会話の重要な一部。
(5)マッチングドリル;写真を見て情況の理解度を図る。計500問題を収録されている。
(2)発音練習;音声認識機能を使って発音練習をすることにより、生徒の発音が適正かどうか判断できるツールを提供する。日本人の発音はそれほど悪くないが、日本人の悪い癖は、子音に母音を添えてしまうこと、すなわち、カタカナ読みをしてしまうことである。発音は、音の位置や口の形で学べるものではなく、それはあくまでも結果論であって、要するに正しい音が出ればいいのである。発音練習を行うことによりロボットとの会話はよりスムーズにすることができるようになる。
(3)会話レッスン;会話の実践をロボットたちがする。ここで、会話の仕方を習います。初級、中級、上級、各15レッスンが収録されている。
(4)リスニングドリル;聞き取りも会話の重要な一部。
(5)マッチングドリル;写真を見て情況の理解度を図る。計500問題を収録されている。
「会話レッスン」を選択した場合について、先ず説明して、その後に他のメニューを選択した場合について説明する。「会話レッスン」を選択した場合、次に会話の内容を選択する。すなわち、会話の相手となるロボットを選択することにより、会話のジャンルを選定する。
(1)自由会話ロボット − 人間と同じように話す。
(2)質疑応答ロボット − ロボットが質問をし、生徒が答える。また、生徒が同じ質問をロボットにし、ロボットが答える。
(3)トリビアロボット − ロボットが、レベルで分けた雑学の質問をし、生徒が答える。ロボットは、正解か不正解かを評価する。
(4)状況ロボット − レストラン、スーパー、空港などの特定の場所での会話練習のために、話題を絞ったロボット。
(2)質疑応答ロボット − ロボットが質問をし、生徒が答える。また、生徒が同じ質問をロボットにし、ロボットが答える。
(3)トリビアロボット − ロボットが、レベルで分けた雑学の質問をし、生徒が答える。ロボットは、正解か不正解かを評価する。
(4)状況ロボット − レストラン、スーパー、空港などの特定の場所での会話練習のために、話題を絞ったロボット。
図7にロボットの選択画面を示す。生徒は好きなロボットを選んで画像をマウスでクリックして選択すれば、そのロボットとの学習が始まる。各ロボットにはその特性を記述した特性値テーブル35が付随しており、特性値テーブル35の「担当分野」の記述によりロボットの機能が定まり、学習内容が決まることとなる。
図8に各ロボットの機能の一覧を示す。特性値テーブル35と合わせて、図8の表がロボットの仕様を規定する。
図9と図10に会話レッスン中に表示装置11に表示される画面の例を示す。図9において、表示画面40の最上部のヘッダー48にはロボットの名前が表示される。図9ではKate Livingstonと表示されている。アバター画面41にはロボットのアバターが表示され、会話中におけるロボットの表情がアニメーション表示される。例えば、喋っているときは、発話に応じて口やあごが動き、質問されたときは目が少し上に移動するなどの表情をとる。生徒のヘッドセットに加速度センサーを取り付けておいて、生徒の顔の動きに合わせてロボットの視線なり顔の向きを変更して表示してもよい。
生徒の発話内容であって音声認識部において認識された入力文がユーザー発話表示ボックス42に文字表示される。ユーザー発話表示ボックス42の表示により、生徒は自分が喋った内容が外国語会話練習システム1に正しく認識されたかどうか知ることができる。生徒は明瞭な発音を心がけなければならないし、周囲の環境も雑音の少ないことが望まれる。不明瞭な発音や周囲の雑音は正しい音声認識の妨げとなる。ユーザー発話表示ボックス42に表示された内容が、自分が喋った内容でないときは、マウス等の指示入力により生徒の発話を取り消して再チャレンジすることができる。マウス等の指示入力の代わりに“なし”と音声によりシステムに指示を与えることができる。なお、ロボットから会話を始めた場合は、ロボットの発話内容がユーザー発話表示ボックス42に表示される。
ロボットの発話内容は、ロボット発話表示ボックス43に表示される。ロボットの発話内容の日本語訳が必要なときは、翻訳ボタン44をクリックすれば翻訳文表示ボックス45に日本語による翻訳文が表示される。
アバター画面41の右には学習アシストボタン46とアシスト表示ボックス47が表示される。学習アシストボタン46には、ロボットの会話のルールを示す「ルール」と、これまでの会話内容を示す「会話記録」と、日常会話においてよく使う表現を表示する「よく使う表現」のボタンが用意されている。図9においては「ルール」が選択された場合におけるアシスト表示ボックス47に表示される内容の例が示されている。「会話記録」を選択すれば、これまでの会話のログが時間経過と共に学習アシストボタン46とアシスト表示ボックス47に表示される。
図10は図9とは異なるロボットにおける会話レッスン時の表示画面であって、学習アシストボタン46で「よく使う表現」が選択された場合のアシスト表示ボックス47の表示内容が示されている。
次に本発明の実施形態に係る外国語会話練習システム1における生徒とロボットの会話の進め方について説明する。すなわち、生徒の質問がどういう経路で、人工知能部7に届き、また、どういう経路で人工知能部7からユーザーパソコン2に戻ってくるのかを説明する。
生徒がマイク10に向かって“What is your name?”と言ったとする。その音声は、まず、ユーザーパソコン2の中の音声認識部6で文字に変換されて入力文となる。入力文は、通信回線4を通って、サーバーコンピュータ3の中に存在する人工知能部7に伝えられる。そして、ロボットが“My name is Ben.”と文字で答えると、今度はその文字が応答文として音声合成部8に送られ、そこで音信号声に変わり、通信回線4を通って、ユーザーパソコン2に戻り、スピーカー12から“My name is Ben."と返事が聞こえてくる。
疑問文(when, where, who, what, which, how)などの疑問詞や、(do, does, is, are, was, were, will etc.)などの助動詞が主語の前に来る場合、入力文は疑問文のカテゴリーに属すると判断される。したがって、“What is your name?”に対する応答文は、人工知能部7において疑問文と解釈されて、疑問文のカテゴリーに属するテンプレートから選ばれる。
<category>
<pattern>WHAT IS YOUR NAME</pattern>
<template>My name is Ben.</template>
</category>
<pattern>WHAT IS YOUR NAME</pattern>
<template>My name is Ben.</template>
</category>
疑問文のカテゴリー<category>からパターンマッチングで一致する<pattern>が探索される。このとき大文字と小文字の区別を無視して、What is your nameと一致するパターンを探す。ここで、<pattern>にはワイルドカードを用いて、WHAT IS YOUR * として、"what is your name" にも "what is your shoe size" にも "what is your purpose in life" にもマッチするようにすればアルゴリズムの単純化を図ることができる。
ここでは、WHAT IS YOUR NAMEに一致したテンプレート <template> My name is Ben.</template>
が応答文として選ばれる。人の名前は会話の相手が変われば変わるものであるので、テンプレートに変数を記載することにより、テンプレートの数を減らすことができるし、会話の内容に柔軟性を持たせることができる。例えば、テンプレートを
が応答文として選ばれる。人の名前は会話の相手が変われば変わるものであるので、テンプレートに変数を記載することにより、テンプレートの数を減らすことができるし、会話の内容に柔軟性を持たせることができる。例えば、テンプレートを
<template>My name is <bot name="name"/>.</template>
として、名前を変数とする。変数であるbot nameは、特性値テーブル35から該当する特性値を代入して応答文を生成する。ロボットのコード番号が101であれば、図5より、"name"の特性値であるBenが代入されて、My name is Benと応答することになる。
テンプレートでは記述言語を使用することができ、条件付応答(if-then/else)も設定できる。更に、テンプレートで srai という要素を使って他のパターンにリダイレクトすることができる。これは、意味が同じで表現が異なる場合に対応する。以下に例を示す。
として、名前を変数とする。変数であるbot nameは、特性値テーブル35から該当する特性値を代入して応答文を生成する。ロボットのコード番号が101であれば、図5より、"name"の特性値であるBenが代入されて、My name is Benと応答することになる。
テンプレートでは記述言語を使用することができ、条件付応答(if-then/else)も設定できる。更に、テンプレートで srai という要素を使って他のパターンにリダイレクトすることができる。これは、意味が同じで表現が異なる場合に対応する。以下に例を示す。
<category>
<pattern>WHAT IS YOUR NAME</pattern>
<template>My name is <bot name="name"/>.</template>
</category>
<category>
<pattern>WHAT ARE YOU CALLED</pattern>
<template>
<srai>what is your name</srai>
</template>
</category>
<pattern>WHAT IS YOUR NAME</pattern>
<template>My name is <bot name="name"/>.</template>
</category>
<category>
<pattern>WHAT ARE YOU CALLED</pattern>
<template>
<srai>what is your name</srai>
</template>
</category>
最初のカテゴリーは単に "what is your name" という質問に答えている。次のカテゴリーでは "what are you called" と入力されたときに "what is your name" と入力されたときと同じ応答をするように指定している。つまり、この2つの文はsariでシステムでは等価に扱われ、同じ応答文が生成される。
次に図14を用いて、人工知能部における会話の処理過程を説明する。なお図14は、図4に示す人工知能部7のファイル構造と関連している。
生徒の入力文が「What kind of music do you like?」であるとき、キーワードを用いたパターンマッチングにより、この会話のカテゴリーは「music」と判断する。そして、入力文の文頭の「what」は疑問文を示すので、目的語を形成する。英語の文章にはSVOとSVCの二通りがあり、疑問文の場合、Whatは目的語になる。
生徒の入力文が「What kind of music do you like?」であるとき、キーワードを用いたパターンマッチングにより、この会話のカテゴリーは「music」と判断する。そして、入力文の文頭の「what」は疑問文を示すので、目的語を形成する。英語の文章にはSVOとSVCの二通りがあり、疑問文の場合、Whatは目的語になる。
応答文生成に際して、「you like」は「I like」と自動的に変換される。したがって「I like (what)」 が出力の応答文形となり、whatの部分に相当する部分はmusic (country, rock, classic, soft, modern)の中から選択されることとなる。会話相手のロボットがIsabelleであれば、図5に示すキャラクターテーブルから求めた「classic」がwhat部分に代入され、応答文として「I like classic music.」 が生成される。
別の応答例について、以下に説明する。
たとえば、入力文が「I really love pigeons.」であったとすると、人工知能部7は、文章のなかの単語を1つづつマッチングさせていゆき、もっとも近いパターンを探し、単語を個別にチェックする。
S: (I*~like*_~birdrelated) I like’_o, too. *は wild card
ステップ1: I(I, my, me, myself, mine) が一番初めに来ている。
ステップ2: ワイルドカード は無し。
ステップ3: ~like (love, favor, prefer) love はlikeの同意語でマッチ。そして、Iの後に来ている。
ステップ4: ワイルドカード は無し。
ステップ5: ~birdrelated (chicken, sparrow, eagle, pigeon, ……) 鳥の範疇にマッチする。
これで全てがマッチしたので、出力は I like _0, too. のパターンを使い、I like pigeons, too. と応答文が生成される。なお、0はワイルドカードがないという意味である。
たとえば、入力文が「I really love pigeons.」であったとすると、人工知能部7は、文章のなかの単語を1つづつマッチングさせていゆき、もっとも近いパターンを探し、単語を個別にチェックする。
S: (I*~like*_~birdrelated) I like’_o, too. *は wild card
ステップ1: I(I, my, me, myself, mine) が一番初めに来ている。
ステップ2: ワイルドカード は無し。
ステップ3: ~like (love, favor, prefer) love はlikeの同意語でマッチ。そして、Iの後に来ている。
ステップ4: ワイルドカード は無し。
ステップ5: ~birdrelated (chicken, sparrow, eagle, pigeon, ……) 鳥の範疇にマッチする。
これで全てがマッチしたので、出力は I like _0, too. のパターンを使い、I like pigeons, too. と応答文が生成される。なお、0はワイルドカードがないという意味である。
入力、出力の順序のバリエーションは、ルールとして、同じトピックの中で、ロボットからの質問がランダムに出るようになっている。生徒からの発話がない場合や話題がない場合は、ロボットから質問を出して会話を進める。
一般に外国語学習において、特に日本人の場合は、生徒が自分から質問することは少ないので、ロボットの方から積極的に質問するように作っている。例えば生徒がI am tired. といえば、 What did you do today? とか、 Did you have enough sleep? といった質問を出力するようになっている。
次に「会話レッスン」以外を選択した場合について説明する。
図6に示したメニュー画面において、「単語ビルダー」を選択した場合、SG単語ビルダー(商標)が起動して図11に示す画面が表示装置11に表示される。SG単語ビルダーには4000語の単語が用意されていて、各単語は図11において升目で示す方形のタイルに対応している。タイルをマウスでクリックして選択することにより、画面中央に問題となる単語(図では“flare”)が表示されるとともに“flare”が読み上げられてスピーカー12から聞こえるようになっている。“flare”の下方には、その日本語訳の候補が表示される(図では“案内係”、“文学”、“容疑者”、“ゆらめく炎、すそ広がり”)。生徒は日本語訳として適切と思える候補をマウスでクリックをして選択する。生徒の選択が正しければ、Correctと画面に表示されると共にスピーカー12を通じて発音される。
図6に示したメニュー画面において、「単語ビルダー」を選択した場合、SG単語ビルダー(商標)が起動して図11に示す画面が表示装置11に表示される。SG単語ビルダーには4000語の単語が用意されていて、各単語は図11において升目で示す方形のタイルに対応している。タイルをマウスでクリックして選択することにより、画面中央に問題となる単語(図では“flare”)が表示されるとともに“flare”が読み上げられてスピーカー12から聞こえるようになっている。“flare”の下方には、その日本語訳の候補が表示される(図では“案内係”、“文学”、“容疑者”、“ゆらめく炎、すそ広がり”)。生徒は日本語訳として適切と思える候補をマウスでクリックをして選択する。生徒の選択が正しければ、Correctと画面に表示されると共にスピーカー12を通じて発音される。
正解するとタイルの色は青(図では黒)から赤(図では白)に変わり、画面の左下に「あなたの単語力」は1増加して(図では10)、画面右下の「知らない単語」は1減少する(図では3990)。画面の表示は保存されるので、次回はその続きを学習することができる。
メニュー画面において、「発音練習」を選択した場合は、図9や図10の画面が表示されて、ユーザー(生徒)は自分の発話内容が正しく音声認識システムに認識されているかどうか知ることができて発音練習をすることができる。ただし「発音練習」において、ロボットは応答することなく、生徒は例えば”次ぎ”もしくは“なし”とシステムに音声で指示をすれば、発音練習を繰り返すことができる。
メニュー画面において「リスニングドリル」を選んだ場合は、図12に示す画面が表示される。画面の左上には絵が表示され(図12では写真)、スピーカー12から“What is the main job of this person?”と音声出力がなされる。写真の下方には選択肢が表示される(図では“cutting”、“building”、“counting”、“designing”)。生徒が選択肢をマウスでポインタすれば、選択肢が読み上げられる。マウスでクリックして選択すれば、それが正しければCorrectと画面に表示されると共に音声出力され、右側に表示したKONGがビルを1段階分だけ登る。
生徒が回答をしないと、問題文が再度読み上げられ、数回読み上げが行われた後に問題文(ここでは“What is the main job of this person?”)が写真の下方に表示される。
画面左下の「NEXT」をマウスでクリックするか“次ぎ”と発話指示することにより、次の問題に進む。
メニューにおいて「マッチングドリル」を選んだ場合は、図13に示す画面が表示される。問題文が読み上げられると共に問題文が表示される(ここでは“Do you have a car?”)。これに対して生徒が4つの選択肢から、もっとも適切と思える解答をマウスで選択する。そうするとその解答が読み上げられ、正解であれば「正解」と画面に表示される。
五目並べゲームであって、質問に正解すると赤い石(図では白)が点灯し、不正解であると青い石が(図では黒)が点灯する。ゲームの勝敗の数が画面下方に表示される。内容の理解とリスニング学習に役立つ。
本発明のコンピュータを利用した外国語会話練習システムによれば、外国語の会話の独習が安価で簡易に行うことができ、外国語の学習に有用である。
1 外国語会話練習システム
2 ユーザーパソコン
3 サーバーパソコン
4 通信回線
6 音声認識部
7 人工知能部
8 音声合成部
10 マイク
11 表示装置
12 スピーカー
13 音声入力部
14 音声分析部
15 入力文出力部
16 記憶装置(音声認識データベース)
20 入力文入力部
21 入力文解析部
22 応答文生成部
23 記憶装置(人工知能データベース)
24 応答文入力部
25 文字音素変換部
26 音声データ照合部
27 音声出力部
28 記憶装置(音声データベース)
30 マッチングファイル
31 カテゴリーファイル
32 単語ファイル
33 文法ファイル
35 特性値テーブル
40 表示画面
41 アバター画面
42 ユーザー発話表示ボックス
43 ロボット発話表示ボックス
44 翻訳ボタン
45 翻訳文表示ボックス
46 学習アシストボタン
47 アシスト表示ボックス
48 ヘッダー
2 ユーザーパソコン
3 サーバーパソコン
4 通信回線
6 音声認識部
7 人工知能部
8 音声合成部
10 マイク
11 表示装置
12 スピーカー
13 音声入力部
14 音声分析部
15 入力文出力部
16 記憶装置(音声認識データベース)
20 入力文入力部
21 入力文解析部
22 応答文生成部
23 記憶装置(人工知能データベース)
24 応答文入力部
25 文字音素変換部
26 音声データ照合部
27 音声出力部
28 記憶装置(音声データベース)
30 マッチングファイル
31 カテゴリーファイル
32 単語ファイル
33 文法ファイル
35 特性値テーブル
40 表示画面
41 アバター画面
42 ユーザー発話表示ボックス
43 ロボット発話表示ボックス
44 翻訳ボタン
45 翻訳文表示ボックス
46 学習アシストボタン
47 アシスト表示ボックス
48 ヘッダー
Claims (9)
- サーバーコンピュータとクライアントコンピュータとが通信回線を介して接続されたサーバークライアントシステムにおいて、
前記クライアントコンピュータには、音声認識部と音声再生部と表示部とを含んでいて、
前記サーバーコンピュータには、人工知能部と音声合成部とを含んでいて、
前記音声認識部は、話者の音声を電気信号に変換するマイクと、当該マイクからの電気信号を音声データに変換する音声入力部と、当該音声入力部からの音声データを文字情報である入力文に変換する音声分析部とを含んでいて、
前記人工知能部は、前記話者に対する応答者を模擬して応答文を生成する部分であって、当該応答者の特性を記述した特性値テーブルを有していて、前記音声認識部から前記通信回線を介して入力された入力文から前記特性値テーブルに基づき応答文を自動的に生成する応答文生成部とを有していて、
前記音声合成部は、前記応答文生成部で生成された応答文を音素データに変換する文字音素変換部を含み、
前記音声再生部は、前記音声合成部から前記通信回線を介して送信される音素データを可聴音声に変換して出力し、
前記表示装置は、音声認識部からの入力文および前記応答文生成部からの応答文を表示してなるコンピュータを利用した外国語会話練習システム。 - 前記応答文生成部において、応答文の候補であるテンプレートが会話の分野を定めるカテゴリー毎に用意されていて、前記カテゴリーの選定が前記入力文に含まれるキーワードによりなされる請求項1に記載のコンピュータを利用した外国語会話練習システム。
- 前記テンプレートには変数を有するものが含まれていて、当該変数の値が前記特性値テーブルから求められてなる請求項1または請求項2に記載のコンピュータを利用した外国語会話練習システム。
- 前記特性値テーブルが複数あり、当該特性値テーブルが前記クライアントコンピュータにおいて選択可能になっている請求項1〜3のいずれか1項に記載のコンピュータを利用した外国語会話練習システム。
- 前記話者との応答に基づき、特性値テーブルもしくはテンプレートの内容が追加修正されてなる請求項1〜4のいずれか1項に記載のコンピュータを利用した外国語会話練習システム。
- 前記表示装置には、応答文の音声出力に合わせて表情が変化するアバターが表示される請求項1〜5のいずれか1項に記載のコンピュータを利用した外国語会話練習システム。
- 学習の内容が複数用意されていて、いずれの学習内容を選定するかが前記クライアントコンピュータにおいて選択可能である請求項1〜6のいずれか1項に記載のコンピュータを利用した外国語会話練習システム。
- システムに対する指示入力がマウスやキーボードの他、前記マイクを通じた音声により行える請求項1〜7のいずれか1項に記載のコンピュータを利用した外国語会話練習システム。
- 音声認識部と、音声再生部と、表示部と、人工知能部と、音声合成部とを含んでいて、
前記音声認識部は、前記話者の音声を電気信号に変換するマイクと、当該マイクからの電気信号を音声データに変換する音声入力部と、当該音声入力部からの音声データを文字情報である入力文に変換する音声分析部とを含んでいて、
前記人工知能部は、
前記話者に対する応答者を模擬して応答文を生成する部分であって、当該応答者の特性を記述した特性値テーブルを有していて、前記音声認識部から前記通信回線を介して入力された入力文から前記特性値テーブルに基づき応答文を自動的に生成する応答文生成部とを有していて、かつ、
前記応答文生成部において、応答文の候補であるテンプレートが会話の分野を定めるカテゴリー毎に用意されていて、前記カテゴリーの選定が前記入力文に含まれるキーワードによりなされ、かつ、
前記テンプレートには変数を有するものが含まれていて、当該変数の値が前記特性値テーブルから求められてなり、かつ、
前記特性値テーブルが複数あり、当該特性値テーブルが前記クライアントコンピュータにおいて選択可能になっていて、
前記話者との応答に基づき、特性値テーブルもしくはテンプレートの内容が追加修正されてなり、
前記音声合成部は、前記応答文生成部で生成された応答文を音素データに変換する音声変換部を含み、
前記音声再生部は、前記音声合成部からの音素データを音声発生器から可聴音声信号として出力して、
前記表示装置は、音声認識部からの入力文および前記応答文生成部からの応答文を表示してなるコンピュータを利用した外国語会話練習システムを収納した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079454A JP2012215645A (ja) | 2011-03-31 | 2011-03-31 | コンピュータを利用した外国語会話練習システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011079454A JP2012215645A (ja) | 2011-03-31 | 2011-03-31 | コンピュータを利用した外国語会話練習システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012215645A true JP2012215645A (ja) | 2012-11-08 |
Family
ID=47268478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011079454A Withdrawn JP2012215645A (ja) | 2011-03-31 | 2011-03-31 | コンピュータを利用した外国語会話練習システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012215645A (ja) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015060056A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社ナガセ | 教育装置並びに教育装置用ic及び媒体 |
KR101519591B1 (ko) | 2013-10-16 | 2015-05-13 | (주)컴버스테크 | 음성인식 기반의 가상 면접 처리 시스템 및 방법 |
JP6032660B1 (ja) * | 2015-07-23 | 2016-11-30 | デレック・ヤキュウチャク | 言語練習用装置、言語教材、および言語練習用プログラム |
JP2017054038A (ja) * | 2015-09-10 | 2017-03-16 | カシオ計算機株式会社 | 学習支援装置及びその学習支援装置用のプログラム |
CN106898166A (zh) * | 2017-03-30 | 2017-06-27 | 河南工学院 | 融入传统文化的外语学习系统及方法 |
JP2017212557A (ja) * | 2016-05-24 | 2017-11-30 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
JP2018001403A (ja) * | 2016-07-07 | 2018-01-11 | 深▲せん▼狗尾草智能科技有限公司Shenzhen Gowild Robotics Co.,Ltd. | 音声と仮想動作を同期させる方法、システムとロボット本体 |
JP2018001404A (ja) * | 2016-07-07 | 2018-01-11 | 深▲せん▼狗尾草智能科技有限公司Shenzhen Gowild Robotics Co.,Ltd. | 音声と仮想動作を同期させる方法、システムとロボット本体 |
WO2018147435A1 (ja) * | 2017-02-09 | 2018-08-16 | 株式会社博報堂 | 学習支援システム及び方法、並びにコンピュータプログラム |
CN108508737A (zh) * | 2018-05-31 | 2018-09-07 | 张育祥 | 一种基于人工智能技术的学生用手表 |
CN109643550A (zh) * | 2017-06-15 | 2019-04-16 | 株式会社Cai梅帝亚 | 对话机器人及对话系统、以及对话程序 |
JP2019086742A (ja) * | 2017-11-10 | 2019-06-06 | 株式会社レイトロン | 言語機能訓練システム、装置、およびプログラム |
KR20190069656A (ko) * | 2017-12-08 | 2019-06-20 | 원태경 | 인공지능강사를 이용한 교육기관 운영 시스템 및 방법 |
JP2020030400A (ja) * | 2018-08-23 | 2020-02-27 | 國立台湾師範大学 | 教育方法及び電子装置 |
JP2020095176A (ja) * | 2018-12-13 | 2020-06-18 | 株式会社Ecc | 語学学習用装置および語学学習用プログラム |
JP2021071723A (ja) * | 2019-10-31 | 2021-05-06 | エルジー シーエヌエス カンパニー リミテッド | 外国語学習装置、外国語学習サービス提供方法、およびコンピュータプログラム |
TWI727413B (zh) * | 2019-05-21 | 2021-05-11 | 麥奇數位股份有限公司 | 基於交流的網路教室建立方法、系統、設備及存儲介質 |
JP2022519981A (ja) * | 2018-12-13 | 2022-03-28 | スクウェア パンダ インコーポレイテッド | 可変速度音素発音機械 |
KR20220082257A (ko) | 2020-12-10 | 2022-06-17 | 주식회사 투비유니콘 | 확률함수를 이용한 자연어의 인식률 계산방법으로 자연어를 분석하는 시스템 |
-
2011
- 2011-03-31 JP JP2011079454A patent/JP2012215645A/ja not_active Withdrawn
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015060056A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社ナガセ | 教育装置並びに教育装置用ic及び媒体 |
KR101519591B1 (ko) | 2013-10-16 | 2015-05-13 | (주)컴버스테크 | 음성인식 기반의 가상 면접 처리 시스템 및 방법 |
JP6032660B1 (ja) * | 2015-07-23 | 2016-11-30 | デレック・ヤキュウチャク | 言語練習用装置、言語教材、および言語練習用プログラム |
JP2017026831A (ja) * | 2015-07-23 | 2017-02-02 | デレック・ヤキュウチャク | 言語練習用装置、言語教材、および言語練習用プログラム |
JP2017054038A (ja) * | 2015-09-10 | 2017-03-16 | カシオ計算機株式会社 | 学習支援装置及びその学習支援装置用のプログラム |
JP2017212557A (ja) * | 2016-05-24 | 2017-11-30 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
JP2018001403A (ja) * | 2016-07-07 | 2018-01-11 | 深▲せん▼狗尾草智能科技有限公司Shenzhen Gowild Robotics Co.,Ltd. | 音声と仮想動作を同期させる方法、システムとロボット本体 |
JP2018001404A (ja) * | 2016-07-07 | 2018-01-11 | 深▲せん▼狗尾草智能科技有限公司Shenzhen Gowild Robotics Co.,Ltd. | 音声と仮想動作を同期させる方法、システムとロボット本体 |
WO2018147435A1 (ja) * | 2017-02-09 | 2018-08-16 | 株式会社博報堂 | 学習支援システム及び方法、並びにコンピュータプログラム |
JPWO2018147435A1 (ja) * | 2017-02-09 | 2020-01-30 | 株式会社博報堂 | 学習支援システム及び方法、並びにコンピュータプログラム |
CN106898166A (zh) * | 2017-03-30 | 2017-06-27 | 河南工学院 | 融入传统文化的外语学习系统及方法 |
CN109643550A (zh) * | 2017-06-15 | 2019-04-16 | 株式会社Cai梅帝亚 | 对话机器人及对话系统、以及对话程序 |
JP2019086742A (ja) * | 2017-11-10 | 2019-06-06 | 株式会社レイトロン | 言語機能訓練システム、装置、およびプログラム |
KR20190069656A (ko) * | 2017-12-08 | 2019-06-20 | 원태경 | 인공지능강사를 이용한 교육기관 운영 시스템 및 방법 |
KR102067877B1 (ko) * | 2017-12-08 | 2020-01-17 | 원태경 | 인공지능강사를 이용한 교육기관 운영 시스템 및 방법 |
CN108508737A (zh) * | 2018-05-31 | 2018-09-07 | 张育祥 | 一种基于人工智能技术的学生用手表 |
JP2020030400A (ja) * | 2018-08-23 | 2020-02-27 | 國立台湾師範大学 | 教育方法及び電子装置 |
JP2020095176A (ja) * | 2018-12-13 | 2020-06-18 | 株式会社Ecc | 語学学習用装置および語学学習用プログラム |
JP2022519981A (ja) * | 2018-12-13 | 2022-03-28 | スクウェア パンダ インコーポレイテッド | 可変速度音素発音機械 |
JP7195593B2 (ja) | 2018-12-13 | 2022-12-26 | 株式会社Ecc | 語学学習用装置および語学学習用プログラム |
US11694680B2 (en) | 2018-12-13 | 2023-07-04 | Learning Squared, Inc. | Variable-speed phonetic pronunciation machine |
TWI727413B (zh) * | 2019-05-21 | 2021-05-11 | 麥奇數位股份有限公司 | 基於交流的網路教室建立方法、系統、設備及存儲介質 |
JP2021071723A (ja) * | 2019-10-31 | 2021-05-06 | エルジー シーエヌエス カンパニー リミテッド | 外国語学習装置、外国語学習サービス提供方法、およびコンピュータプログラム |
JP7059492B2 (ja) | 2019-10-31 | 2022-04-26 | エルジー シーエヌエス カンパニー リミテッド | 外国語学習装置、外国語学習サービス提供方法、およびコンピュータプログラム |
KR20220082257A (ko) | 2020-12-10 | 2022-06-17 | 주식회사 투비유니콘 | 확률함수를 이용한 자연어의 인식률 계산방법으로 자연어를 분석하는 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012215645A (ja) | コンピュータを利用した外国語会話練習システム | |
US6134529A (en) | Speech recognition apparatus and method for learning | |
US7149690B2 (en) | Method and apparatus for interactive language instruction | |
US5717828A (en) | Speech recognition apparatus and method for learning | |
Ashwell et al. | How Accurately Can the Google Web Speech API Recognize and Transcribe Japanese L2 English Learners' Oral Production?. | |
Michael | Automated Speech Recognition in language learning: Potential models, benefits and impact | |
CN101501741A (zh) | 互动式外语教学 | |
Godwin-Jones | Speech tools and technologies | |
US20080140411A1 (en) | Reading | |
Griol et al. | An architecture to develop multimodal educative applications with chatbots | |
CN101551947A (zh) | 辅助口语语言学习的计算机系统 | |
KR20220011109A (ko) | 디지털 영어 학습 서비스 방법 및 시스템 | |
KR101071392B1 (ko) | 학습자 맞춤형 외국어 교육 시스템 및 외국어 교육 방법 | |
KR101004913B1 (ko) | 음성인식을 활용한 컴퓨터 주도형 상호대화의 말하기 능력평가 장치 및 그 평가방법 | |
KR100995847B1 (ko) | 인터넷상에서의 소리분석 기반 어학 학습방법 및 시스템 | |
KR100703047B1 (ko) | 사용자가 실제 장면의 화면 안에서 연기하며 주도하는능동적인 외국어 말하기 학습 시스템 및 방법 | |
Brown et al. | Shaping learners’ pronunciation: Teaching the connected speech of North American English | |
JP2019061189A (ja) | 教材オーサリングシステム | |
JP6656529B2 (ja) | 外国語の会話訓練システム | |
CN101739852B (zh) | 基于语音识别的实现自动口译训练的方法和装置 | |
Wang et al. | A spoken translation game for second language learning | |
CN111326030A (zh) | 一种集读听写识字学习系统、装置及方法 | |
CN115905475A (zh) | 答案评分方法、模型训练方法、装置、存储介质及设备 | |
US20080145824A1 (en) | Computerized speech and communication training | |
Shivakumar et al. | AI-ENABLED LANGUAGE SPEAKING COACHING FOR DUAL LANGUAGE LEARNERS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140603 |