JPH1138863A - 言語情報装置 - Google Patents

言語情報装置

Info

Publication number
JPH1138863A
JPH1138863A JP9192601A JP19260197A JPH1138863A JP H1138863 A JPH1138863 A JP H1138863A JP 9192601 A JP9192601 A JP 9192601A JP 19260197 A JP19260197 A JP 19260197A JP H1138863 A JPH1138863 A JP H1138863A
Authority
JP
Japan
Prior art keywords
voice
sentence
information
conversation
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9192601A
Other languages
English (en)
Inventor
Yoshimasa Kudou
賀正 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP9192601A priority Critical patent/JPH1138863A/ja
Publication of JPH1138863A publication Critical patent/JPH1138863A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】 身近な会話の練習を一人でも効果的に行うこ
とのできる言語情報装置を提供する。 【解決手段】 各文例の先頭には役割指示表示31によ
り役割が表示されており、各文例毎に役割が特定される
ようになっている。装置が発声する役割の文例の表示は
マスクして音声を出力する。また、利用者が発声した発
音が、記憶された文例の発音にどの程度近似しているか
(距離)を知らせるための表示(距離表示32)がなさ
れ、自分の発音が相手に通じるか否かの判定ができるよ
うになっており、さらに、距離に応じて会話が進行す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、外国語の会話学
習または外国人との会話に用いる言語情報装置に関す
る。
【0002】
【従来の技術】従来より、一人で外国語を学習するため
に、外国語の会話が録音されたカセットテープやコンパ
クトディスクなどを用いていたが、ヒアリング中心の学
習となり、会話することはできなかった。
【0003】また、会話においてはヒアリング力と同時
に相手に意志を伝えるためのスピーキング力も重要であ
る。スピーキングの学習には、外国人の先生との間で会
話文例における役割を決めて、交互に話し、発音のチェ
ックを受けることが効果的である。しかし、外国語を母
国語とする先生がそばにいない場合には一人で練習をす
ることはできない。一人で会話の練習をする方法とし
て、カセットテープやコンパクトディスクなどに学習者
の音声をマスクして録音した会話形式のものを使って
も、自分の発音で相手に伝わるものか確信をもつことは
できない。
【0004】従来技術では発声された音声を認識する手
段が提案されており、特開平6−110494号には、
発音の正誤を通知する装置が開示されている。また、特
開平8−185308号には、正しく言語を認識できな
かった場合に、音声の再入力を促す装置が開示されてい
る。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来技術では、音声認識により会話を進行させていくよう
にしては、会話の練習を行うことはできなかった。本発
明は、上述した課題を解決するためになされたものであ
り、身近な会話の練習を一人でも効果的に行うことので
きる言語情報装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上述した問題を解決する
ために本発明は、所定の言語による会話の文例情報を記
憶する文例記憶手段と、前記文例情報に対応した音声情
報を記憶する音声記憶手段と、少なくとも利用者が役割
を担当する会話部分を除いた他の会話部分の文例を前記
文例情報に基づいて表示する表示手段と前記利用者が役
割を担当する会話部分を空白期間として他の会話部分の
音声を前記音声情報に基づいて出力する音声出力手段
と、前記利用者の音声を入力する音声入力手段と、前記
音声入力手段によって入力される入力音声情報と前記利
用者が役割を担当する会話部分の音声情報との間で音声
の特徴量を比較し、該比較結果を出力する音声評価手段
とを具備することを特徴とする。
【0007】
【発明の実施の形態】以下図面を参照して本発明の実施
形態について説明する。 1.第1実施形態 1−1.第1実施形態の構成
【0008】(1)外観構成 図1は、本実施形態にかかる言語情報装置の外観を示し
た図である。この言語情報装置には、利用者が視覚によ
り情報を確認するためのLCD101、音声を出力する
ためのスピーカー102、音声を入力するためのマイク
103、機能・場面の選択や音声の出力等を指示するた
めのキースイッチ群104、およびタッチパネル105
が設けられている。
【0009】LCD101は情報を表示する液晶ディス
プレイであり、ドットマトリックスによって文例・語句
・絵文字等を同時に表示することが可能である。タッチ
パネル105はLCD101の上に密着しており、利用
者が選択した文例等を検知するものである。利用者は、
指またはペンを用いて画面に表示されている対象を直接
押圧することにより選択する。なお、タッチパネル10
5は透過性が高く、タッチパネル105の上からLCD
101の表示を見ることができる。
【0010】また、キースイッチ群104には、電源の
ON/OFFを指示する電源キー104a、言語表示を
切り替える訳キー104b、選択等を確定する確定キー
104c、表示を戻すための戻るキー104d、表示を
隠すためのマスクキー104e、音声を発声させる音声
キー104f、連続して発声させる連続音声キー104
g、および、上下左右にカーソルを移動させるカーソル
キー104h〜104kが含まれている。
【0011】(2)電気的構成 図2は、実施形態の電気的構成を示したブロック図であ
る。CPU11は、バス12を介して、ROM13、R
AM14、不揮発性メモリ15、LCDコントローラ&
ドライバー16、タッチパネル105、キースイッチ群
104、A/Dコンバータ19、およびD/Aコンバー
タ20と接続されている。
【0012】ROM13には、プログラム、文例のテキ
ストデータ、文字フォントデータ、文例に対応した音声
データ、および文例を音声認識するための音声特徴パラ
メータが記憶されている。CPU11は、高速に各デバ
イスとデータの授受が可能であり、ROM13からプロ
グラムを読み出し、そのプログラムに従って各種の処理
を実行する。
【0013】例えば、文字をLCD101に表示する場
合は、ROM13から文例のテキストデータを読み出
し、1文字ずつフォントデータに変換し、LCDコント
ローラ&ドライバー16へ転送する。LCDコントロー
ラ&ドライバー16はLCD101に接続されており、
表示の制御をすることができる。
【0014】また、音声を出力する場合は、ROM13
から文例に対応した音声データを読み出し、所定の時間
間隔毎にD/Aコンバータ20に音声データを転送す
る。音声データは、D/Aコンバータ20でアナログ信
号に変換され、アンプ18で増幅され、スピーカー10
2から音声として出力される。
【0015】また、マイク103から音声が入力された
場合は、音声はマイク103で電気的アナログ信号に変
換され、フィルター17で不要な周波数帯域がカットさ
れ、A/Dコンバータ19でデジタルデータに変換され
る。CPU11は、A/Dコンバータ19から所定時間
間隔で音声データを入力しRAM14に蓄積する。
【0016】不揮発性メモリ15は、電源をOFFとし
た後も記憶内容を保持するメモリであり、入力した音声
データや、利用者が設定したデータや選択したデータを
電源がOFFとなっている時でも保持することができ
る。
【0017】1−2.第1実施形態の動作 次に、上記構成を有する言語情報装置の動作について説
明する。 (1)本装置の操作 まず、図3に示す状態遷移図を参照し、本装置の操作面
から第1実施形態の動作について説明する。電源をON
にすると、場面選択画面が表示される。図4の具体例に
示すように、場面選択画面では複数の場面が表示され、
利用者は所望の場面をその中から選択することができ
る。選択は、上下カーソルキー104k・104iを押
下し、画面中のカーソル(図中矢印で示している)を目
的の位置まで移動することにより行う。
【0018】所望の場面にカーソルを合わせ、確定キー
104cを押下すると、選択した場面に対応した役割設
定画面が表示される。機能選択画面の具体例を図5に示
す。機能選択画面では、装置がどのような役割を果たす
か(装置の機能)を選択する。役割設定画面で選択でき
る機能には、 本装置がAの役割を果たす機能 本装置がBの役割を果たす機能 会話文例を英語で表示する機能 会話文例を日本語で表示する機能 の4機能があり、利用者は場面選択画面と同様の操作に
よって機能を選択することができる。なお、装置に記憶
されている文例はAB2者による会話形式になってお
り、あるいはを選択するときは、本装置がA・Bい
ずれかの役割を果たして、利用者と会話を行う形式の表
示・発声する場合であり、あるいはを選択するとき
は装置がAB両方の文例を表示・発声する場合である。
【0019】を選択すると、役割Aの連続音声画面が
表示され、装置との間の会話が開始される。そして、会
話が終了すると機能選択画面に戻る。同様にを選択す
ると、役割Bの連続音声画面が表示され、装置との間の
会話が開始され、会話が終了すると機能選択画面に戻
る。なお、連続音声とは、選択された場面の各文例につ
いて連続して音声の入出力を行うことであり、・に
おいては、装置の音声出力と利用者の音声入力が連続し
て行われ、・においては装置が全文例の音声出力を
行う。ここで、図6は、役割Aの連続音声画面の表示例
を、図7は、役割Bの連続音声画面の表示例を示してい
る。これらの画面では、装置がスピーチする文例は「*
***……」マークによりマスクされている。
【0020】また、を選択すると、会話文例表示画面
(英語)115が表示され、会話文の全文が英語で表示
される。図8は、会話文例表示画面(英語)115の具
体例である。を選択すると、会話文例表示画面(日本
語)116が表示され、会話文の全文が日本語で表示さ
れる。図9は、会話文例表示画面(日本語)116の具
体例である。
【0021】ここで、会話文例表示画面(英語)115
において訳キー104bが押下された場合は会話文例表
示画面(日本語)116が表示され、会話文例表示画面
(日本語)116において訳キー104bが押下された
場合は会話文例表示画面(英語)115が表示される。
これにより日本語と英語相互の全文訳を確認することが
できる。また、音声キー104fを押下すると、表示さ
れている1文例を発声させることができ、連続音声キー
104gを押下すると、1場面文の全例文を連続して音
声出力することができる。
【0022】次に、〜のいずれかの機能が選択され
た場合の動作について説明するが、およびの会話文
例表示機能が選択された場合の動作は、従来の言語情報
装置と同様であるため説明の詳細は省略する。
【0023】(2)装置が役割Aの場合の連続音声動作 ここで、機能あるいはが選択された場合、すなわ
ち、会話の連続音声の動作について説明する。なお、こ
こでは装置がAの役割を果たす場合の文例について説明
するが、装置がBの役割を果たす場合でも同様の動作と
なる。図10は、動作時の連続音声画面の表示例であ
る。図10に示すように、装置が発声する文例は表示せ
ず、”******”の表示によってマスクしている。
また、各文例の先頭には役割指示表示31により役割が
表示されており、各文例毎に役割が特定されるようにな
っている。図中の表示例に示すように、表示するマーク
によって役割を区別し、表示されたどの文例が利用者の
役割の文例であるかを指示する。また、利用者が発声し
た発音が、記憶された文例の発音にどの程度近似してい
るか(以下距離という)を知らせるための表示(距離表
示32)がなされ、自分の発音が相手に通じるか否かの
判定ができるようになっている。
【0024】ここで、文例データについて説明する。文
例データは、場面毎に英語および日本語のテキストデー
タ、英語および日本語の音声データ、および文番号が対
応づけられて記憶されている。図11は、「オフィスで
電話をうける」場面における英文テキストデータの例を
示している。第1実施形態では、装置(役割A)と利用
者(役割B)の交互の発声による会話という設定であ
り、AとBの役割の文例が交互に記憶されている。そし
て、処理は文例0001から順に行われ、最大の文番号
(図11では0005)の処理が終了するとその場面が
終了する。
【0025】図12は、第1実施形態における会話の連
続音声の動作を示すフローチャートである。会話の連続
音声の動作が開始すると、まず処理対象の文番号(以下
n)を0001とする(ステップ120)。次に、音声
の出力速度を初期化し(ステップ121)、音声の入力
回数を初期化する(ステップ122)。ここで、音声の
出力速度とは、装置の役割Aに対応する文番号n(00
01)の音声出力速度をいい、音声の入力回数とは、利
用者の役割Bに対応する文番号n+1の音声の入力回数
をいう。
【0026】初期化が終了すると、装置の役割Aの文例
である文番号n=0001を音声出力する(ステップ1
23)。図11の例では、"Hello. This is Fuji Xero
x."の音声を出力する。次に、役割Bの利用者が、文番
号n+1=0002の"This is SUZUKI of IROHA COMPA
NY. May I speak to Mr. TANAKA?"を発声する番にな
る。装置は、文番号0002の音声入力待ち状態とな
り、利用者が発声すると、マイク103から音声が入力
される。
【0027】ここで、音声入力タイマーをリセットし、
該タイマーをスタートした後、文番号0002の表示を
ブリンクする(ステップ124)。なお、ブリンクと
は、音声入力待ちとなっている文例を指示する表示方法
であって、図10の例では役割指示表示31を点滅させ
ることをいうが、これに限らず、例えば、アンダーライ
ンや文例自体を反転させたりすることであってもよい。
また、音声入力タイマーとは、音声入力待ちとなってい
る文例について音声が入力されるまでの時間を計測する
ためのものであり、ここでは、文番号0002について
の計測を行う。
【0028】そして、処理は音声入力待ちとなり(ステ
ップ125)、音声入力が無い場合は、音声入力タイマ
ーの計測した時間が所定の時間に達している(すなわ
ち、タイムアウト)か否かを判定する(ステップ12
6)。いまだタイムアウトとなっていない場合は、処理
はステップ125に戻り、音声入力待ちとなる。また、
タイムアウトになった場合(ステップ132以下)につ
いては後述する。なお、音声入力の有無の判定は、装置
が認識する音量にしきい値を設け、しきい値以上の音量
を装置が認識した場合は、音声入力有と判断する。そし
て、入力音声の音量がしきい値を下回った場合は、音声
入力が終了したものと判断して次の処理に進む。
【0029】次に、タイムアウトとなる前に利用者が文
番号0002の発声をした場合の処理について説明す
る。音声はマイク103から入力され、ステップ127
において特徴パラメータが算出される。ここで、特徴パ
ラメータとは、音声データの特徴量、すなわち、音声デ
ータが有する特徴を量的に示した値をいう。マイク10
3から入力された音声は、A/Dコンバータ19におい
てデジタルデータに変換されてRAM14に蓄積されて
いる。CPU11は、RAM14から音声データを読み
出し、その波形特性を数値化する。数値化の方法は従来
技術の手法を用いるものとし、説明は省略する。一方、
ROM13に記憶されている各英語文例には、各文例に
対応して標準音声特徴パラメータが記憶されている。
【0030】利用者が文例どおりに発声しているか否か
は、ROM13に記憶されている標準音声特徴パラメー
タと、入力した音声の特徴パラメータを比較し、距離を
求めることによって判断する(ステップ128)。そし
て、求めた距離を表示し(ステップ129)、どれだけ
標準的なパターンとの差(つまり発音の類似度)がある
かを利用者に知らせる。距離には、予め許容量が設定さ
れており、距離が許容値内であれば、文番号0002は
正しく発音されたと認識して処理はステップ131に進
む。距離が許容値を越えている場合は、文例は正しく発
音されていないものと認識し、処理はステップ132へ
進む(ステップ130)。なお、許容値は予め規定値が
記憶されていても、利用者が任意に設定できるようにし
てもよい。
【0031】図10に示す表示例では、距離は距離表示
32に図示するように表示する。表示がより左にあると
きは距離が大きく、より右にあるときは距離が小さい。
そして表示位置が図示する"GOOD"以上であるときは許容
値内であることを示し、"EXCELLENT"は標準的パターン
との差がない(距離=0)場合であることを示す。ま
た、許容値を越える場合は、"GOOD"以下に表示される。
【0032】ここで、文例が正しく発音されていない場
合、あるいは所定の時間内に音声入力がされなかった場
合の処理(ステップ132以下)について説明する。こ
の場合、まず音声入力回数が判断される(ステップ13
2)。利用者は、装置が発声する文例を聞き取り、その
発声に返答する形式で練習を行う。このとき、装置が発
声する文例の表示はマスクされていため、音声出力速度
が速すぎると、利用者が装置の発声した発音を聞き取る
ことができない場合がある。例えば、利用者がなんら発
声しないときあるいは所定の回数を越えて誤った発音を
している場合は、装置の発音を聞き取れていない場合で
あると推定できる。かかる場合には、所定の回数に達す
るまで、段階的に音声出力速度を下げる処理を行う(ス
テップ134以下)。
【0033】音声入力回数が3回未満の場合は、音声の
再入力を促す表示をし(ステップ134)、音声入力回
数のカウント値を1だけアップカウントする(ステップ
135)。そして音声出力速度の設定を所定の値だけ遅
くして(ステップ136)、ステップ123に戻り、1
番目の文例を再度音声出力する。利用者は、1回目より
もゆっくり発声される2回目の"Hello. This is Fuji X
erox."を聞いた後、"This is SUZUKI of IROHA COMPAN
Y. May I speak to Mr. TANAKA?"を発声する。このよう
に、利用者のレベルに応じた会話練習を行うことができ
る。
【0034】しかし、ステップ132において音声入力
回数が3回を越えている場合は、これ以上音声出力を遅
くすることはせず、利用者が文番号0002を発声でき
なかったものとしてエラーを表示し(ステップ13
3)、次の処理(ステップ131)へ進む。そして、こ
の段階では文番号0002の処理は終了しているため、
文番号0002の表示のブリンクを停止する(ステップ
137)。次に、文番号n+1(ここでは0002)が
この場面の最終番号であるかを判断し、n+1が最終番
号でない場合は、n=n+2(0003)とする(ステ
ップ138)。
【0035】nが場面の最終番号でない場合は(ステッ
プ139)、処理はステップ121にもどり、n(00
03)の音声速度設定を初期化した後(ステップ12
1)、n+1(0004)の音声入力回数を初期化し
(ステップ122)、装置の役割である文番号0003
の音声を出力する。
【0036】このように、装置の発声を利用者が聞き取
ることができ、利用者が所定の回数内で正しく発声した
場合は、装置が次の文番号の文例を発声して返答する。
これらの処理が繰り返されることにより、利用者は、ヒ
アリングの練習およびスピーキングの練習を一人でも簡
単に行うことができる。
【0037】こうして、装置と利用者の役割を果たす処
理を繰り返し、ステップ137においてn+1が最終番
号(利用者の役割が最終番号)であれば、次に装置が発
声する文例が存在しないため、この場面の処理は終了す
る。
【0038】一方、ステップ139においてnが最終番
号(装置の役割が最終番号)である場合は、次に利用者
の音声入力待ちとする必要がないため、文番号nの音声
出力をした(ステップ140)後、この場面の処理は終
了する。なお、上述の例では、装置から発声が始まる
(装置がAの役割を果たす)場合について説明している
が、利用者から発声が始まる(装置がBの役割を果た
す)場合は、ステップ120ではn=0となり、一回目
のステップ123においては装置の発声処理は行われな
いものとする。
【0039】2.第2実施形態 次に、第2実施形態について説明する。第2実施形態で
は、より会話らしい練習を可能とするため、会話の連続
音声において文例を固定せず、返答に応じて会話の文例
が選択される。第2実施形態のハードウエア構成は第1
実施形態と同様であるので説明を省略し、動作について
は、第1実施形態と異なる点についてのみ以下説明す
る。
【0040】(1)連続音声動作の概念 ある場面において、会話は常に固定的なやり取りが行わ
れるとは限らない。例えば第1実施形態において説明し
た「オフィスで電話をうける」場面でも、電話のかかっ
てきた人が在席している場合と不在の場合が考えられ
る。在席している場合は、電話をかわれば会話は終了す
るが、電話がかかってきた人が不在である場合は返事が
必要である。また、不在の理由にも様々なケースがあ
り、相手に対応する返事の言葉も異なる。図13は、
「オフィスで電話をうける」場面の応答のパターンの例
を示したフローチャートである。
【0041】図13に示すような会話が成立するような
文例データを記憶しておく。すなわち、ある場面から想
定される会話のパターンを、予め各ケースに応じて、文
例同士を対応づけた形式で記憶しておく。ここで、文同
士の対応を図14および図15に示すデータを例として
説明する。図14は、「オフィスで電話をうける」場面
のデータの例を示している。第1実施形態で使用したデ
ータ(図12)では、文番号0001から順番に会話が
進行するように記憶されていたが、第2実施形態で使用
するデータは、予め想定された全てのフレーズが記憶さ
れている。また、図15は、各文番号毎にその文番号の
後に続き得る文番号を記憶したデータの例である。
【0042】例えば図13に示すように、"Hello. This
is Fuji Xerox."(図14:文番号0001)の後に
は、"This is SUZUKI of IROHA COMPANY. May I speak
to Mr.TANAKA?"(文番号0002)が必ず続く。そこ
で、文番号0001に対応し、次の文番号として000
2のみが記憶されている。しかし、文番号0002の後
には、在席している場合(文番号0003)・席を外し
ている場合(文番号0004)・既に帰宅した場合(文
番号0009)・休暇の場合(文番号0014)・外出
帰社予定なしの場合(文番号0015)・長期休暇の場
合(文番号0016)・長期出張の場合(文番号002
1)が続き得る。そこで、文番号0002に対応し、次
の文番号として0003、0004、0009、001
4、0015、0016、0021が記憶されている。
【0043】さらに、休暇の場合(文番号0014)が
選択された場合は、伝言の要(文番号0010)否(文
番号0012)により次の文例が異なるため、文番号0
014に対応して、次の文番号として0010、001
2が記憶されている。ここで伝言要(文番号0010)
が選択された場合は、その後には文番号0011のみが
続くため、文番号0010に対応して、次の文番号とし
て0011のみが記憶されている。そして、文番号00
11は会話の終了の文例であるため、文番号0011に
対応して、次の文番号は記憶されず、終了を意味するデ
ータが記憶されている。図15では(END)としてい
るが、どのような形式であってもよい。例えば、具体的
には図16に示す会話が、装置と利用者の間で行われ
る。
【0044】(2)装置が役割Aの場合の連続音声動作 次に、装置と利用者の会話が成立していく過程について
説明する。図17および図18は、第2実施形態におけ
る会話の連続音声の動作を示すフローチャートである。
なお、ここでは装置が役割Aを果たすものとする。処理
が開始すると、まず、文番号の個数を初期化(m=1)
し(ステップ201)、現在の文番号(n)として最初
の文番号をセットする(ステップ202)。ここで、変
数nは処理対象となる文番号を表すものとし、まず場面
において一番最初に発声される文例の文番号(000
1)を初期文番号としてnに格納する(ステップ20
2)。
【0045】また、文番号の個数とは、処理対象の文番
号に対応して記憶されている次の文番号の個数であり、
文番号nが処理された後で次の文番号のうちのどの文例
を処理対象として選択するかを決定するために使用され
る数値である(後述する)。なお、最初の文例では必ず
m=1となる。
【0046】次にステップ203において、利用者がA
の役割を果たす場合はステップ204に、利用者がBの
役割を果たす場合はステップ221に進む。この例で
は、利用者がBの役割を果たすので、ステップ221に
進む。そして、m=1であるため(ステップ221)、
処理対象の文番号(n=0001)の文例の表示をブリ
ンクしながら音声出力する(ステップ225)。すなわ
ち、装置(役割A)が"Hello. This is Fuji Xerox."を
表示するとともに発声する。図19は、文番号0001
が表示された例である。第2実施形態では、装置が発声
する場合に文例のマスクは行わない。また、文例は発声
のされたもののみ表示される。
【0047】役割Aの装置が発声した次は、役割Bの利
用者が発声する順番となり、装置は音声入力待ちとな
る。しかし、装置が発声した文番号nの次の文番号の個
数は必ずしも1個とは限らない。また文番号nが会話の
終了の文例である場合もある。そこで、ステップ225
では、文番号nの次の文番号データのすべてをROM1
3(図2)から取り出し、RAM14(図2)に記憶し
ておく。なお、ここでは、n=0001であるので、取
り出される次の文番号は0002のみである。次に、取
り出したデータがENDを示すデータか否かを判断し
(ステップ226)、ENDの場合は処理を終了し、E
NDでない場合はステップ204に進む。
【0048】ステップ204以下の処理は、利用者の役
割(ここでは役割B)が発声されるときの処理である。
装置は、装置が発声した文番号nの次の文番号のいずれ
かについて利用者の音声入力待ちとなっている。また、
第1実施形態と同様、利用者が所定の時間内に発声しな
い場合や、所定の回数内で正しい発声がされない場合に
次の文例に進む処理を行う。そのため、音声入力回数を
初期化し(ステップ204)、次に音声入力タイマーを
初期化して(ステップ205)、音声入力待ちとなり、
タイマーは時間の計測を始める。そして、ステップ20
6において音声入力がなかった場合は、ステップ207
に進み、タイマーの示す時間が、所定の時間を越えた場
合(すなわちタイムアウト)は、ステップ212に進
む。
【0049】一方、ステップ206で音声入力があった
場合は、入力された音声の特徴パラメータを算出する
(ステップ208)。次に、入力した音声の特徴パラメ
ータと、RAM14に記憶された文番号のそれぞれの標
準音声特徴パラメータとの距離を求め(ステップ20
9)、最も距離の小さい文例の距離を表示する(ステッ
プ210)。すなわち、利用者が発声した音声は、装置
の発声した文番号nの次にくる文番号のいずれに最も近
似するかを、音声特徴パラメータにより判断し選択す
る。なお、ここでは、文番号n=0001の次にくる文
番号は0002のみであるので、文番号0002の標準
音声特徴パラメータとの距離が表示される。そして選択
された文例と、入力された音声特徴パラメータの距離
が、所定の許容量を越えている場合は(ステップ21
1)、ステップ212に進み、音声入力回数が判断され
る。
【0050】音声入力回数が3回未満である場合は(ス
テップ212)、音声の再入力を指示する表示を行い
(ステップ213)、音声入力回数のカウント値を1だ
けアップカウントする(ステップ214)。そしてステ
ップ205に戻り再度音声入力タイマーを初期化し(ス
テップ205)、装置は音声入力待ちとなる(ステップ
206)。
【0051】また、ステップ212において音声入力回
数が3回以上となっているときには、エラーを表示して
次の文例の処理(ステップ216)に進む。ところで、
選択された文例と、入力された音声特徴パラメータの距
離が、所定の許容量内である場合も(ステップ21
1)、次の文例の処理(ステップ216)に進む。ステ
ップ216では、最も距離の小さい文例の文番号を、処
理対象の文番号と入れ替える。すなわち、ここではnの
値は0001から0002に入れ替えられる。
【0052】そして、文番号n(0002)の文例を表
示した後(ステップ217)、nの次にくる文例を取り
出しRAM14に記憶するとともに、文番号の個数をm
に格納する(ステップ218)。ここではn=0002
であるので、取り出された文番号データは、0003、
0004、0009、0014、0015、0016、
0021の7個であり、m=7となる。この取り出した
データがENDを示すデータであれば、処理は終了する
が(ステップ219)、ENDではない場合は、処理は
ステップ221へ進み、次は装置(ここではA)の役割
の文例が処理される。
【0053】ステップ221において、文例の個数が1
であれば、既述の通りステップ224へ進むが、文例の
個数が2個以上すなわちm≧2である場合は、取り出さ
れRAM14に記憶された文番号データの中のいずれか
の文例を選択する処理を行う(ステップ222)。選択
は、m個の疑似乱数を生成することにより行う。そし
て、疑似乱数に対応した1個の文番号のみ処理対象とし
てセットし(ステップ223)、ステップ224に進
む。
【0054】ここでは文番号0014が選択されたもの
とする。すなわち、利用者(役割B)が"This is SUZUK
I of IROHA COMPANY. May I speak to Mr. TANAKA?"
(文番号0002)を発声した後に、装置(役割A)は
7個のいずれの返答を行うことも可能であったが、既に
帰宅した場合の返答"I'm sorry. TANAKA is takeing ad
ay off doday. May I take a message?"(文番号001
4)を行ったのである。このように、装置が返答しうる
文例のいずれかを選択するかについて、疑似乱数を用い
て、利用者が予測が困難なものとすることにより、より
会話らしい練習を一人で行うことができる。
【0055】そして、文番号0014の次の文番号の全
部(0010、0012)をROM13から取り出し、
RAM14に記憶する(ステップ225)。取り出した
文番号はENDを示すデータではないため(ステップ2
26)、処理はステップ204に進む。
【0056】次は、利用者(役割B)の処理となり、音
声入力回数および音声入力タイマーが初期化され(ステ
ップ204、205)、音声入力がされた場合は(ステ
ップ206)音声特徴パラメータが算出され(ステップ
208)、文番号0010および0012の標準音声特
徴パラメータとの距離が求められる(ステップ20
9)。ここで利用者が"Please call SUZUKI tomorrow.
The number is 1-234-567-890"(文番号0010)と発
声した場合は、入力された音声特徴パラメータは、文番
号0012の標準音声特徴パラメータよりも文番号00
10の標準音声特徴パラメータとの距離が小さくなり、
文番号0010との距離が表示される(ステップ21
0)。距離が所定の許容範囲内であれば(ステップ22
1)、最も距離の小さい文番号(0010)が表示され
(ステップ216)、次にくるべき文番号をROM13
から取り出す(ステップ218)。ここでは、文番号0
010の次であるので0011のみがRAM14に記憶
され、m=1となる。
【0057】取り出されたデータはENDを示すデータ
ではないため(ステップ219)、ステップ221に進
み、装置(役割A)処理となる。ここではm=1である
ため、"Yes, sure."(文番号0011)の表示をブリン
クしながら、音声を出力する(ステップ224)。次
に、文番号0011の次の文番号をROM13から取り
出し(ステップ225)、取り出されたデータはEND
を示すデータであるため(ステップ226)、この場面
の処理は終了する。
【0058】以上のように、ある文例の次にくる文例が
複数あるときに、次が装置の役割であれば疑似乱数を用
いて次の文例を選択し、次が利用者の役割であれば、利
用者が適切と判断して発声した文が、選択可能な文例と
最も近似する文として装置に認識されて会話が進行す
る。これにより、場面ごとの会話文が固定されずより会
話らしい練習を行うことが可能となる。
【0059】3.変形例 なお、本発明は既述した実施形態に限定されるものでは
なく、以下のような各種の変形が可能である。
【0060】実施形態では、日本語を母国語とする人が
英語を学ぶ場合を例に説明したが、これに限定されるも
のではなく、複数の言語から選択できるようにしてもよ
い。また、実施形態では2人の会話文を例として説明し
たが、これに限らず3人以上による会話であってもよ
い。
【0061】また、データは装置に内蔵されたROM1
3に記憶されたものを使用しているが、例えばフロッピ
ーディスクやROMカートリッジなどの外部の記録媒体
から読み出すことができるよう構成してもよい。同様
に、装置を制御するプログラムを記録する媒体は、RO
M13に限らず、例えばフロッピーディスク、CD−R
OM、ハードディスク等の記録媒体であってもよい。
【0062】また、利用者が音声入力を行うことができ
る回数は、3回までとしたが、これに限らず他の値を用
いても、利用者が任意に設定できるようにしてもよい。
また、入力された音声特徴パラメータと標準音声特徴パ
ラメータの差を表示する方法は実施形態に限定されず、
例えば数値や段階に応じたマークを表示したり、差の程
度を表す音声出力により行ってもよい。実施形態では既
定の文例のみを使用したが、人名や地名などの固有名詞
や数字などを入力できるようにして、文の一部を利用者
が作成できるようにしてもよい。その場合、ROM13
に記憶されたプログラムに従って、入力されたテキスト
データを音声データに変換して出力するものとする。
【0063】第1実施形態では、装置側の役割の文例は
マスクしたが、表示できるようにしてもよく、「マスク
する」あるいは「表示する」のいずれかを利用者が選択
できるようにしてもよい。その場合は例えばマスクキー
104f(図1)を使用する。
【0064】第2実施形態では、疑似乱数を用いて複数
の文例から選択したが、他の方法でもよく、例えば所定
の値や最小あるいは最大の文番号を選択するようにして
もよい。
【0065】また、第2実施形態では装置側の役割の文
例はマスクせずに表示したが、より会話らしい練習をす
るためにマスクできるようにしてもよい。その場合、例
えばマスクキー104f(図1)を使用する。
【0066】実施形態では、会話文例表示画面(英語)
115および会話文例表示画面(日本語)116を切り
替えることにより場面の全文訳を確認できるものとした
が、単語や熟語毎に訳を表示できるようにしてもよい。
図19は、単語・熟語訳表示機能画面の例である。図1
9に示す例では、利用者はカーソルキー104h〜10
4kを押下することにより画面中下線の引いてある単語
あるいは熟語のいずれかを選択し、訳キー104bを押
下すると、選択された単語あるいは熟語の訳を表示した
ウインドウが表示される。
【0067】
【発明の効果】以上説明したように、本発明によれば、
身近な会話の練習を一人でも効果的に行うことのできる
言語情報装置を提供することが可能となる。
【図面の簡単な説明】
【図1】 言語情報装置の外観を示した図である。
【図2】 実施形態の電気的構成を示したブロック図で
ある。
【図3】 本装置の状態遷移を示した図である。
【図4】 場面選択画面の具体例を示した図である。
【図5】 割設定画面の具体例を示した図である。
【図6】 役割Aの連続音声画面の表示例を示した図で
ある。
【図7】 役割Bの連続音声画面の表示例を示した図で
ある。
【図8】 話文例表示画面(英語)の具体例を示した図
である。
【図9】 会話文例表示画面(日本語)の具体例を示し
た図である。
【図10】 動作時の連続音声画面の表示例を示した図
である。
【図11】 英文テキストデータの例を示した図であ
る。
【図12】 第1実施形態における連続音声の動作を示
すフローチャートである。
【図13】 「オフィスで電話をうける」場面の応答の
パターンの例を示したフローチャートである。
【図14】 「オフィスで電話をうける」場面の文例デ
ータを示した図である。
【図15】 各文番号毎にその文番号の後に続き得る文
番号を記憶したデータを示した図である。
【図16】 選択された会話文の例を示した図である。
【図17】 第2実施形態における連続音声の動作を示
すフローチャートである。
【図18】 第2実施形態における連続音声の動作を示
すフローチャートである。
【図19】 番号0001が表示された例を示した図で
ある。
【図20】 単語・熟語訳表示機能画面の例を示した図
である。
【符号の説明】
11……CPU(音声評価手段)、12……バス、13
……ROM(文例記憶手段、音声記憶手段)、14……
RAM、15……不揮発性メモリ、101……LCD、
16……LCDコントローラ&ドライバー(表示手
段)、102……スピーカー、18……アンプ、20…
…D/Aコンバータ(音声出力手段)、103……マイ
ク、17……フィルター、19……A/Dコンバータ
(音声入力手段)、104……キースイッチ群、105
……タッチパネル、

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 所定の言語による会話の文例情報を記憶
    する文例記憶手段と、 前記文例情報に対応した音声情報を記憶する音声記憶手
    段と、 少なくとも利用者が役割を担当する会話部分を除いた他
    の会話部分の文例を前記文例情報に基づいて表示する表
    示手段と 前記利用者が役割を担当する会話部分を空白期間として
    他の会話部分の音声を前記音声情報に基づいて出力する
    音声出力手段と、 前記利用者の音声を入力する音声入力手段と、 前記音声入力手段によって入力される入力音声情報と前
    記利用者が役割を担当する会話部分の音声情報との間で
    音声の特徴量を比較し、該比較結果を出力する音声評価
    手段とを具備することを特徴とする言語情報装置。
  2. 【請求項2】 前記会話の文例情報が3人以上の会話に
    よって構成されていることを特徴とする請求項1記載の
    言語情報装置。
  3. 【請求項3】 前記音声出力手段は、前記音声入力手段
    によって入力される入力音声のレベルが所定レベル以下
    に下がったときに前記空白期間を解除することを特徴と
    する請求項1記載の言語情報装置。
  4. 【請求項4】 前記音声出力手段は、前記空白期間の開
    始時点からの経過時間を計時し、前記音声入力手段によ
    る音声入力が所定時間以上ない場合に、少なくとも一つ
    前の会話文から音声を再出力することを特徴とする請求
    項1記載の言語情報装置。
  5. 【請求項5】 前記音声評価手段は、前記入力音声情報
    から抽出した第1の音声特徴量と前記利用者が役割を担
    当する会話部分の音声情報から抽出した第2の音声特徴
    量との差を算出し、 前記音声出力手段は、前記音声評価手段によって算出さ
    れた差の値が所定値以上である場合に少なくとも一つ前
    の会話文から音声を再出力することを特徴とする請求項
    1記載の言語情報装置。
  6. 【請求項6】 前記音声出力手段は、音声速度を下げて
    音声の再出力を行うことを特徴とする請求項4または5
    記載の言語情報装置。
  7. 【請求項7】 前記会話の文例情報は、異なる会話の展
    開に対応して複数の文例によって構成されており、 前記表示手段は、複数の文例の中から所定のルールに従
    って選択した文例を表示するとともに、 前記音声出力手段は、前記選択した文例に対応する音声
    を出力することを特徴とする請求項1記載の言語情報装
    置。
  8. 【請求項8】 前記文例は、乱数に基づいて任意に選択
    されることを特徴とする請求項7記載の言語情報装置。
  9. 【請求項9】 前記音声評価手段は、入力音声情報と利
    用者が役割を担当する会話部分の異なる会話の展開に対
    応した複数の文例の音声情報との間で各々音声の特徴量
    を比較し、最も特徴量が近い比較結果を出力する音声評
    価手段とを具備することを特徴とする請求項7記載の言
    語情報装置。
  10. 【請求項10】 コンピュータによって構成された言語
    情報装置に、 所定の言語による会話の文例情報を記憶する文例記憶機
    能と、 前記文例情報に対応した音声情報を記憶する音声記憶機
    能と、 少なくとも利用者が役割を担当する会話部分を除いた他
    の会話部分の文例を前記文例情報に基づいて表示する表
    示機能と前記利用者が役割を担当する会話部分を空白期
    間として他の会話部分の音声を前記音声情報に基づいて
    出力する音声出力機能と、 前記利用者の音声を入力する音声入力機能と、 前記音声入力手段によって入力される入力音声情報と前
    記利用者が役割を担当する会話部分の音声情報との間で
    音声の特徴量を比較し、該比較結果を出力する音声評価
    機能とをを実現させるためのプログラムを記録した記録
    媒体。
JP9192601A 1997-07-17 1997-07-17 言語情報装置 Pending JPH1138863A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9192601A JPH1138863A (ja) 1997-07-17 1997-07-17 言語情報装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9192601A JPH1138863A (ja) 1997-07-17 1997-07-17 言語情報装置

Publications (1)

Publication Number Publication Date
JPH1138863A true JPH1138863A (ja) 1999-02-12

Family

ID=16293986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9192601A Pending JPH1138863A (ja) 1997-07-17 1997-07-17 言語情報装置

Country Status (1)

Country Link
JP (1) JPH1138863A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024139A1 (fr) * 1999-09-27 2001-04-05 Kojima Co., Ltd. Systeme d'evaluation de la prononciation
JP2002156897A (ja) * 2000-11-17 2002-05-31 Fuji Xerox Co Ltd 発音学習装置
JP2003150040A (ja) * 2001-11-07 2003-05-21 Inventec Corp ユーザの外国語発話および聴取能力を訓練するシステムおよび方法
JP2003195887A (ja) * 2001-12-27 2003-07-09 Asahi Kasei Corp 発音判定システム、発音判定プログラム、判定システム制御用プログラム、利用者用端末制御プログラム、発音判定方法及び発音判定システム管理用サーバ
JP2006023373A (ja) * 2004-07-06 2006-01-26 Institute Of National Colleges Of Technology Japan 言語学習支援システム、及び言語学習支援プログラム
JP2007017733A (ja) * 2005-07-08 2007-01-25 Sharp Corp 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体
JP2007504496A (ja) * 2003-09-02 2007-03-01 フェアフィールド ランゲージ テクノロジーズ 言語教育用システムおよび方法
JP2009163265A (ja) * 2001-12-12 2009-07-23 Gnb Co Ltd 思考単位と連結質問を用いる言語教育方法
JP2015049515A (ja) * 2013-09-02 2015-03-16 イートーク カンパニー リミテッドEtalk Co., Ltd. 言語学習プログラムおよびそれを記録したコンピュータで読み取り可能な記録媒体
JP2016114673A (ja) * 2014-12-12 2016-06-23 カシオ計算機株式会社 電子機器およびプログラム
JP2020003806A (ja) * 2019-08-08 2020-01-09 カシオ計算機株式会社 電子機器およびプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024139A1 (fr) * 1999-09-27 2001-04-05 Kojima Co., Ltd. Systeme d'evaluation de la prononciation
JP2002156897A (ja) * 2000-11-17 2002-05-31 Fuji Xerox Co Ltd 発音学習装置
JP2003150040A (ja) * 2001-11-07 2003-05-21 Inventec Corp ユーザの外国語発話および聴取能力を訓練するシステムおよび方法
JP2009163265A (ja) * 2001-12-12 2009-07-23 Gnb Co Ltd 思考単位と連結質問を用いる言語教育方法
JP2003195887A (ja) * 2001-12-27 2003-07-09 Asahi Kasei Corp 発音判定システム、発音判定プログラム、判定システム制御用プログラム、利用者用端末制御プログラム、発音判定方法及び発音判定システム管理用サーバ
JP2007504496A (ja) * 2003-09-02 2007-03-01 フェアフィールド ランゲージ テクノロジーズ 言語教育用システムおよび方法
JP2011197691A (ja) * 2003-09-02 2011-10-06 Rosetta Stone Ltd 言語教育用システムおよび方法
JP2006023373A (ja) * 2004-07-06 2006-01-26 Institute Of National Colleges Of Technology Japan 言語学習支援システム、及び言語学習支援プログラム
JP2007017733A (ja) * 2005-07-08 2007-01-25 Sharp Corp 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体
JP2015049515A (ja) * 2013-09-02 2015-03-16 イートーク カンパニー リミテッドEtalk Co., Ltd. 言語学習プログラムおよびそれを記録したコンピュータで読み取り可能な記録媒体
JP2016114673A (ja) * 2014-12-12 2016-06-23 カシオ計算機株式会社 電子機器およびプログラム
JP2020003806A (ja) * 2019-08-08 2020-01-09 カシオ計算機株式会社 電子機器およびプログラム

Similar Documents

Publication Publication Date Title
US5870709A (en) Method and apparatus for combining information from speech signals for adaptive interaction in teaching and testing
TW503388B (en) Speech recognition enrollment for non-readers and display less devices
CN101346758B (zh) 感情识别装置
JPH0962293A (ja) 音声認識対話装置および音声認識対話処理方法
JPH1138863A (ja) 言語情報装置
JP6613560B2 (ja) 電子機器、学習支援方法およびプログラム
JP6841309B2 (ja) 電子機器およびプログラム
JP6166831B1 (ja) 単語学習支援装置、単語学習支援プログラム、単語学習支援方法
KR100898104B1 (ko) 상호 대화식 학습 시스템 및 방법
JP7376071B2 (ja) コンピュータプログラム、発音学習支援方法及び発音学習支援装置
KR20050015585A (ko) 향상된 음성인식 장치 및 방법
KR100848148B1 (ko) 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체
JP2001249679A (ja) 外国語自律学習システム
JP2002156897A (ja) 発音学習装置
JPH0344690A (ja) 会話マナー教育システム
JP2002132291A (ja) 自然言語対話処理装置およびその方法並びにその記憶媒体
JP2001188788A (ja) 会話処理装置および方法、並びに記録媒体
JP7013702B2 (ja) 学習支援装置、学習支援方法、及び、プログラム
JP2001051580A (ja) 音声学習装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JPH07168520A (ja) 学習習熟度判別装置付き語学用教育装置
JP4623278B2 (ja) 音声対話装置、支援装置、生成装置、音声対話方法、支援方法、生成方法およびプログラム
KR20090119043A (ko) 대화형 언어 학습 장치
JPH10326074A (ja) 語学訓練装置の制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050105