JPH11143346A - 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 - Google Patents

語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体

Info

Publication number
JPH11143346A
JPH11143346A JP9303202A JP30320297A JPH11143346A JP H11143346 A JPH11143346 A JP H11143346A JP 9303202 A JP9303202 A JP 9303202A JP 30320297 A JP30320297 A JP 30320297A JP H11143346 A JPH11143346 A JP H11143346A
Authority
JP
Japan
Prior art keywords
utterance
speaker
evaluation
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9303202A
Other languages
English (en)
Inventor
Yasunaga Miyazawa
康永 宮沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP9303202A priority Critical patent/JPH11143346A/ja
Publication of JPH11143346A publication Critical patent/JPH11143346A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】 英会話など他国の言語による会話を練習する
場合、特徴的な要素を比較することによって客観的な評
価を行い効率の良い練習を可能とする。 【解決手段】 手本の持っている各発話内容ごとに、そ
の発話内容について各フレームごとに音声分析し、複数
の要素としての発音、アクセント、抑揚、テンポ、を表
すデータを予め求めておく。そして、話者の発話した発
話内容について各フレームごとに音声分析し(ステップ
s2)、前記複数の要素に対するデータを求め、この話
者のデータと前記手本のデータとを、パターンマッチン
グによる各フレーム間の対応付けを行い、発音について
の評価(ステップs3)、アクセントについての評価
(ステップs4)、抑揚についての評価(ステップs
5)、テンポについての評価(ステップs6)を行った
のち話者の発話に対する評価値を出力する(ステップs
7,s8)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は英会話などを練習す
る場合、ユーザの発話内容に対して評価を行う語学練習
用発話評価方法およびその装置並びに発話評価処理プロ
グラムを記憶した記憶媒体に関する。
【0002】
【従来の技術】最近、英語など他国の言語での会話を勉
学する人が増えてきている。従来、他国言語の会話を練
習する場合、専門の学校に通ったりするのが一般的であ
るが、自分で勉強する人も多い。
【0003】しかし、他国言語の会話は、発音やアクセ
ント、抑揚、発話のテンポなどが日本語とは大きく異な
るため、一人での練習ではなかなか上達しないのが現状
である。そこで、従来より、一人で練習するための会話
練習機やそのソフトなども幾つか開発されてきている。
たとえば、カセットテープなどで手本となる先生の発話
する内容を、ユーザが真似て発話するものもその一つで
ある。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
この種の会話練習機やそのソフトは、手本の発話内容を
自分なりに真似て発話することにより、それぞれの言語
独特の発音、アクセント、抑揚、会話のテンポを覚えよ
とするものが殆どであり、ユーザの発話した会話につい
て客観的な評価を与えてくれるものでは少ない。さら
に。それぞれの言語に特有の発音、アクセント、抑揚、
テンポなどそれぞれについてきめ細かく評価するという
ものはなかった。したがって、ユーザにとっては、自分
の発話に対する発音、アクセント、抑揚、テンポなどが
本当に適正なものかを判断できないのが現状であった。
【0005】そこで本発明は、ユーザの発話した会話内
容に対して、発音、アクセント、抑揚、テンポなど、発
話の適正さを判断するための指標となる複数の要素につ
いて客観的な評価を行い、且つこれらを総合した評価を
与えることを可能とし、効率的な他国言語の会話練習を
可能する語学練習用発話評価方法およびその装置並びに
発話評価処理プログラムを記憶した記憶媒体を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】前述したような目的を達
成するために、本発明の請求項1に記載の語学練習用発
話評価方法は、手本の発話内容に従って発話した話者の
音声を分析して得られたデータと前記手本の発話内容に
対するデータとを比較して、話者の発話評価を行う語学
練習用発話評価方法において、手本の持っているそれぞ
れの発話内容ごとに、その発話内容についてそれぞれの
フレームごとに音声分析し、発話の適正さを判断するに
必要な要素に対するデータを予め求めておき、話者の発
話した発話内容についてそれぞれのフレームごとに音声
分析し、前記発話の適正さを判断するに必要な要素に対
するデータを求め、この話者のデータと前記手本のデー
タとを、パターンマッチングによる各フレーム間の対応
付けを行ってそれぞれのデータ間を比較し、その比較結
果に基づいて話者の発話評価を行うことを特徴としてい
る。
【0007】そして、前記発話の適正さを判断するに必
要な複数の要素は、発音、アクセント、抑揚、発話のテ
ンポであって、これらの各要素のうち少なくとも1つを
用い、発音についての評価は、前記データとして話者の
音声の特徴を表す音声特徴データと手本の音声の特徴を
表す音声特徴データを用い、両者の音声特徴データをパ
ターンマッチングによるフレーム間の対応付けを行って
比較し、その比較結果を基に話者の発音についての評価
を行い、 アクセントについての評価は、前記データと
して話者のパワー情報と手本のパワー情報を用い、前記
音声特徴データの対応付けに用いられた各フレーム間の
対応関係を用いて、話者と手本のパワー情報を対応づけ
て比較し、その比較結果を基にアクセントについての評
価を行い、抑揚についての評価は、前記データとして話
者のピッチ情報と手本のピッチ情報を用い、前記音声特
徴データの対応付けに用いられた各フレーム間の対応関
係を用いて、話者と手本のピッチ情報を対応づけて比較
し、その比較結果を基に抑揚についての評価を行い、テ
ンポについての評価は、手本の発話内容を幾つかに区切
ることによって複数の区間を設定し、それぞれの区間に
おける時間情報を求めておき、話者の発話内容に対して
も、前記パターンマッチングによるフレーム間の対応付
けを用いて、前記手本の区切りに対応する区切りごとに
区切って、それにより設定された区間ごとの時間情報を
求め、前記手本における各区間ごとの時間情報と話者の
対応する区間における時間情報とを比較し、その比較結
果をもとに発話のテンポの評価を行うようにしている。
【0008】さらに、前記アクセントについての評価を
行う際、話者のパワーと手本のパワーとをそれぞれのフ
レームごとに差を取り、その差分を基にアクセントにつ
いての評価を行う処理と、話者のパワーの極大値と手本
のパワーの極大値とを比較し、その時間的位置とそのパ
ワーの大きさを基にアクセントについての評価を行う処
理の少なくとも1つの処理を行うようにしている。
【0009】また、前記話者の発話についての評価を行
う際、手本の発話内容を幾つかに区切って複数の区間を
設定し、話者の発話内容に対しても、前記パターンマッ
チングによるフレーム間の対応付けを用いて、前記手本
の区切りに対応する区切りごとに区切って、それにより
設定された区間ごとに、前記発話の適正さを判断するに
必要な要素についての評価を行うとともに、全区間に渡
って前記発話の適正さを判断するに必要な要素について
の評価を行い、さらに、その発話内容全体に対する総合
的な評価を行うようにしている。
【0010】また、前記話者の発話評価を行う際、話者
の音声と手本の音声に対して話者正規化処理を施したの
ち発話評価処理を行うようにしてもよい。
【0011】また、請求項6に記載された本発明の語学
練習用発話評価装置は、手本の発話内容に従って発話し
た話者の音声を分析して得られた音声データと前記手本
の発話内容に対する音声データとを比較して、話者の発
話評価を行う語学練習用発話評価装置において、手本の
持っているそれぞれの発話内容についてそれぞれのフレ
ームごとに求められた発話の適正さを判断するに必要な
要素に対するデータを、それぞれの発話内容ごとに記憶
する手本音声データ記憶部と、話者の音声を入力する音
声入力部と、この音声入力部に入力された話者の発話し
た発話内容について、それぞれのフレームごとに音声分
析し、前記発話の適正さを判断するに必要な要素に対す
るデータをフレームごとに求める入力音声分析部と、こ
の入力音声分析部により求められた話者のデータと前記
手本のデータとを、パターンマッチングによるそれぞれ
のフレーム間の対応付けを行ってデータ間を比較し、そ
の比較結果に基づいて話者の発話についての評価を行う
発話評価処理部と、この発話評価処理部による評価内容
に基づいた評価結果を出力する評価結果出力部とを有す
る構成としたことを特徴としている。
【0012】また、前記発話の適正さを判断するに必要
な要素は、発音、アクセント、抑揚、発話のテンポであ
って、これらの各要素のうち少なくとも1つを用い、前
記発話評価処理部が行う発音についての評価は、前記デ
ータとして話者の音声の特徴を表す音声特徴データと手
本の音声の特徴を表す音声特徴データを用い、両者の音
声特徴データをパターンマッチングによるフレーム間の
対応付けを行って比較し、その比較結果を基に話者の発
音についての評価を行い、アクセントについての評価
は、前記データとして話者のパワー情報と手本のパワー
情報を用い、前記音声特徴データの対応付けに用いられ
た各フレーム間の対応関係を用いて、話者と手本のパワ
ー情報を対応づけて比較し、その比較結果を基にアクセ
ントについての評価を行い、抑揚についての評価は、前
記データとして話者のピッチ情報と手本のピッチ情報を
用い、前記音声特徴データの対応付けに用いられた各フ
レーム間の対応関係を用いて、話者と手本のピッチ情報
を対応づけて比較し、その比較結果を基に抑揚について
の評価を行い、 テンポについての評価は、手本の発話
内容を幾つかに区切ることによって設定された複数の区
間ごとの時間情報と、前記パターンマッチングによるフ
レーム間の対応付けにより前記手本の区切りに対応して
区切られて設定された話者の発話内容に対するそれぞれ
の区間ごとの時間情報とを比較し、その比較結果をもと
に発話のテンポの評価を行うようにしている。
【0013】そして、前記発話評価処理部は、アクセン
トについての評価を行う際、話者のパワーと手本のパワ
ーとをそれぞれのフレームごとに差を取り、その差分を
基にアクセントについての評価を行う処理と、話者のパ
ワーの極大値と手本のパワーの極大値とを比較し、その
時間的位置とそのパワーの大きさを基にアクセントにつ
いての評価を行う処理の少なくとも1つの処理を行うよ
うにしている。
【0014】また、前記発話評価処理部は、手本の発話
内容を幾つかに区切って複数の区間を設定し、話者の発
話内容に対しても、前記パターンマッチングによるフレ
ーム間の対応付けを用いて、前記手本の区切りに対応す
る区切りごとに区切って、それにより設定された区間ご
とに、前記発話の適正さを判断するに必要な要素につい
ての評価を行うとともに、全区間に渡って前記発話の適
正さを判断するに必要な要素についての評価を行い、さ
らに、その発話内容全体に対する総合的な評価を行うよ
うにしている。
【0015】さらに、前記発話評価処理部の前段に、話
者の音声と手本の音声に対して話者正規化処理を施す話
者正規化処理手段を設け、この話者正規化処理手段によ
り話者正規化処理を行ったのち、発話評価処理を行うよ
うにしてもよい。
【0016】また、請求項11に記載された本発明の発
話評価処理プログラムを記憶した記憶媒体は、手本の発
話内容に従って発話した話者の音声を分析して得られた
データと前記手本の発話内容に対するデータとを比較し
て、話者の発話評価を行う発話評価処理プログラムを記
憶した記憶媒体において、前記発話評価処理プログラム
は、手本の持っているそれぞれの発話内容ごとに、その
発話内容についてそれぞれのフレームごとに音声分析
し、発話の適正さを判断するに必要な要素に対するデー
タを予め求めて記憶させておき、話者の発話した発話内
容についてそれぞれのフレームごとに音声分析し、前記
発話の適正さを判断するに必要な要素に対するデータを
求め、この話者のータと前記手本のデータとを、パター
ンマッチングによる各フレーム間の対応付けを行ってデ
ータ間を比較し、その比較結果に基づいて話者の発話評
価を行うことを特徴としている。
【0017】本発明は、英語など他国言語での会話を効
率よく練習可能とするものである。これを実現するため
に、本発明は、手本の持っているそれぞれの発話内容ご
とに、発話の適正さを判断するに必要な要素に対するそ
れぞれのデータを予め求めて記憶させておき、話者の発
話した発話内容について、前記発話の適正さを判断する
に必要な要素に対するデータを求め、両者のデータを、
パターンマッチングによる各フレーム間の対応付けを行
って比較することで、話者の発話評価を行うようにして
いる。これにより、話者の発話に対して客観的な評価が
可能となり、しかも、発話の適正さを判断するに必要な
複数の要素それぞれについて評価するので、正確な評価
を行うことができる。
【0018】なお、この発明では、発話の適正さを判断
するに必要な複数の要素として、発音、アクセント、抑
揚、さらに、発話のテンポを用いている。したがって、
各国の言語に特徴的な要素についての評価を行うことが
できる。
【0019】また、その評価を行う際、ある1つの発話
内容において、各要素ごとの評価、その発話内容の各区
間ごとの評価、その発話内容全区間の評価、さらには、
これらを総合した総合評価も可能となり、ユーザは、自
分の発話について、よい部分と悪い部分をきめ細かに知
ることができ、効率のよい会話練習を行うことができ
る。
【0020】さらに、アクセントの評価を行う際、話者
のパワーと手本のパワーとをそれぞれのフレームごとに
差を取り、その差分を基にアクセントについての評価を
行う処理と、話者のパワーの極大値と手本のパワーの極
大値とを比較し、その時間的位置とそのパワーの大きさ
を基にアクセントについての評価を行う処理を組み合わ
せた処理を行うようにすることで、より一層、適正なア
クセントについての評価が可能となり、特に、話者のパ
ワーの極大値と手本のパワーの極大値とを比較すること
で、1つの発話内容全体のアクセントだけではなく、部
分的なアクセントについて評価することもでき、重要な
部分のアクセントについての練習を効率よく行うことが
できる。
【0021】加えて、前記話者の発話評価を行う際、話
者の音声と手本の音声とを話者正規化処理を行ったのち
に発話評価処理を行うことにより、得られる評価値の信
頼性をより一層向上させることができる。
【0022】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。なお、この実施の形態では、他国
言語として英語を例にとり、英会話の練習を行う例につ
いて説明する。
【0023】図1は本発明の実施の形態による英会話練
習評価の概略的な処理手順を説明するフローチャートで
あり、以下、このフローチャートを参照しながら概略的
な処理手順について説明する。
【0024】図1において、まず、音声入力の有無を判
定し(ステップs1)、音声入力が有れば、音声区間を
切り出し、その音声区間を分析する(ステップs2)。
この音声分析処理は、ユーザの発話する会話内容につい
て音声特徴量、音量(以下、パワーという)、ピッチな
どの情報、さらには、発話内容を幾つかの区間に区切っ
た区間ごとの時間情報などを検出する処理であり、これ
ら各情報については後に詳細に説明する。
【0025】これら音声特徴量、パワー、ピッチ、時間
情報のうち、まず、音声特徴量を用いて、ユーザの音声
特徴量と手本の音声特徴量とを、パターンマッチングに
よる対応付けを行って発音についての評価を行う(ステ
ップs3)。
【0026】そして次に、ユーザの音声波形から求めら
れたパワーの情報と手本のパワー情報とを、前述した音
声特徴量の対応付けを行ったときのパターンマッチング
の対応付けを用いて比較し、アクセントについての評価
を行う(ステップs4)。さらに、ユーザの音声波形か
ら求められたピッチに関する情報と手本のピッチ情報と
を、前述した音声特徴量の対応付けを行ったときのパタ
ーンマッチングの対応付けを用いて比較し、抑揚につい
ての評価を行う(ステップs5)。
【0027】次に、発話のテンポについての評価を行う
(ステップs6)。この発話のテンポの評価は次のよう
にして行う。まず、発話内容の手本の発話内容を予め幾
つかの区間に区切っておき、音声特徴量を求めたときの
パターンマッチングの対応付けを用いて手本の発話内容
の区切り点に対応するユーザの発話した発話内容の区切
り点を求め、手本の区切り点間の時間的長さと、それに
対応する区間におけるユーザの区切り点間の時間的長さ
を比較して、発話のテンポを評価する。
【0028】そして、ステップs3〜s6で求められた
4つの評価をもとに話者の発話評価処理を行い(ステッ
プs7)、その評価結果を数字やグラフ等で表示する
(ステップs8)。
【0029】以上の処理内容はこの実施の形態を概略的
に説明したもので、以下に、詳細に説明する。
【0030】ステップs2における音声分析処理は、発
話の適正さを判断するに必要な要素に対して評価値を求
めるための各種データを抽出するもので、その要素とし
ては、発音、アクセント、抑揚、テンポであり、これら
の要素を評価するに必要なデータとして、音声特徴量、
パワー、ピッチ、各区間ごとの時間情報を抽出する。
【0031】一方、手本の持っているそれぞれの発話内
容についても音声分析処理を行っておき、それぞれの発
話内容ごとに、音声特徴量、パワー、ピッチ、各区間ご
との時間情報を抽出しておく。
【0032】今、手本の発話内容が「Are you ready
?」であったとし、その音声波形が、図2(a)のよ
うな波形であったとする。
【0033】このような音声波形をたとえば20msec
(シフト量はたとえば10msec)というような短時間ご
とに区切って、それぞれ区切られた区間を1フレームと
し、音声の特徴を表す情報としての音声特徴ベクトル
(LPCケプストラム係数など)を、それぞれのフレー
ムごとに求める。また、音声のパワーをそれぞれのフレ
ームごとに求めるとともに、音声のピッチをそれぞれの
フレームごとに求める。なお、ピッチは、ここでは、そ
れぞれのフレームごとに平均の周波数を求め、その求め
られた平均の周波数をそれぞれのフレームにおけるピッ
チと呼ぶ。
【0034】このようにして求められた手本の発話内容
における各フレームごとに求められたパワーを結んだ曲
線を図2(b)に示し、手本の発話内容における各フレ
ームごとに求められたピッチを結んだ曲線を図2(c)
に示す。なお、ピッチはすべてのフレームごとに求める
必要はなく、予め設定された区間のみを比較するように
してもよい。ここでの予め設定された区間というのは、
発話内容において特徴的な部分、たとえば、発話内容が
疑問文であれば、尻上がりとなる最後のフレーズのみの
ピッチについてユーザの発話内容と手本の発話内容とを
比較する。なお、この具体的な説明は後述する。
【0035】さらに、手本の発話内容を幾つかの区間に
区切って、各区間ごとの時間情報を得る。この発話内容
を幾つかの区間に区切って、それぞれの区間を求める方
法としては、音声波形を見ながらパワーの大きさなどを
基にして、1つの発話内容を幾つかの区間に予め区切っ
ておく。たとえば、手本の発話内容として「Are you
ready ?」について考えると、図2(a)に示される
ように、「are」、「you」、「ready」を3箇所の区切
り点p1,p2,p3で区切り、3つの区間(区間1、
区間2、区間3)を設定することができる。そして、各
区間ごとの時間情報を得る。ここでは、図2(d)に示
すように区間1の時間をT1、区間2の時間をT2、区
間3の時間をT3とする。
【0036】以上のようにして手本の音声波形に対する
音声特徴ベクトル、パワー、ピッチ、各区間ごとの時間
情報などを、それぞれの会話練習用の発話内容ごとに求
めておく。
【0037】一方、「Are you ready ?」をユーザ
が発話した場合の音声波形が図2(e)であったとす
る。このような音声波形を、前記手本の音声波形と同じ
く、短時間(20msec、シフト量は10msec)ごとに区
切って、区切られた区間を1フレームとし、音声の特徴
を表す情報としての音声特徴ベクトル(LPCケプスト
ラム係数)を、それぞれのフレームごとに求める。同様
に、それぞれのフレームごとのパワーを求めるととも
に、それぞれのフレームごとのピッチを求める。さら
に、各区間ごとの時間情報を求める。この各区間ごとの
時間情報を求める方法については後述する。
【0038】このようにして求められたユーザの発話内
容(「Are you ready ?」)における各フレームご
とに求められたパワーを結んだ曲線を図2(f)に示
し、各フレームごとに求められたピッチを結んだ曲線を
図2(g)に示す。
【0039】次に、ユーザの発話内容をもとに求められ
た各フレームごとのパラメータのうち、まず、音声特徴
ベクトル(LPCケプストラム係数)を用い、このユー
ザの音声波形から得られた各フレームごとの音声特徴ベ
クトルと手本の音声波形から得られた各フレームごとの
音声特徴ベクトルとを、DPマッチングを行ってそれぞ
れの音声特徴ベクトル間の対応付けを行い、両者の距離
を求める。このDPマッチングによる対応付けを行う
際、各フレームごとのLPCケプストラム係数だけでな
く、Δ(デルタ)LPCケプストラム係数も用いる。
【0040】このΔLPCケプストラム係数は、ここで
は、隣接するフレームのLPCケプストラム係数との差
分のLPCケプストラム係数とするが、その求め方はこ
れに限られるものではない。このように、パターンマッ
チング(ここではDPマッチング)による対応付けを行
う際、 LPCケプストラム係数だけではなくΔLPC
ケプストラム係数をも用いることにより、より一層、高
精度な対応付けが可能となる。
【0041】そして、以上の処理により求められた手本
の発話データとユーザの発話データとの距離を基にして
発音の評価値を求める。なお、この評価値を出す際、発
話内容全体の評価値だけでなく、前述した区間1、区間
2、区間3それぞれにおける評価値を出すようにする。
このそれぞれの区間を求める場合、手本の発話内容につ
いては、前述したように、音声波形を見ながらパワーの
大きさなどを基にして、手本の1つの発話内容を幾つか
の区間に予め区切るが、ユーザの発話内容については、
この手本の区切り点p1,p2,p3に基づいて自動的
に区切ることができる。
【0042】たとえば、ユーザが「Are you ready
?」と発話したとき、その発話内容について手本の3箇
所の区切り点p1,p2,p3に対応する区切り点p1
1,p12,p13を抽出する。これは、音声特徴ベク
トルの対応付けを行うために用いたフレーム間の対応関
係を用いることによって、手本の3箇所の区切り点p
1,p2,p3に対応する区切り点p11,p12,p
13を求めることができる。そして、これらの区切り点
p11,p12,p13によりユーザの発話内容の区間
1、区間2、区間3が得られ、図2(h)に示すよう
に、区間1における時間T11、区間2における時間T
12、区間3における時間T13を得ることができる。
【0043】ところで、これら区間1、区間2,区間3
において、前述したようなDPマッチングによる音声特
徴ベクトルの各フレームごとの対応付けによる評価値
(発音についての評価値)をそれぞれ求める。一例とし
て、図3に示すように、区間1では評価値0.8、区間2
では評価値0.9、区間3では評価値0.5というようにそれ
ぞれの区間ごとの評価値が求められたとする。また、そ
の発話内容全体(区間1から区間3まで)の評価値とし
て0.7という値が求められたとする。
【0044】以上の音声特徴ベクトル(LPCケプスト
ラム係数)を用いてDPマッチングを行い、ユーザと手
本の音声データ間の距離を求めてその距離に基づく評価
値を算出する処理は、図1におけるステップs3の処理
であり、このステップs3の処理により、ユーザの発音
が適正か否かの評価を行うことができる。なお、この実
施の形態では、評価値が高いほど適正な発音であるもの
とする。
【0045】次に、パワーを用いてアクセントについて
の評価を行う。このパワーを用いてのアクセントの評価
は、図1におけるステップ4の処理であり、以下のよう
にして行う。
【0046】まず、前述した音声特徴ベクトルの対応付
けを行うために用いたフレーム間の対応関係を用いて、
ユーザの発話内容の各フレームのパワーと手本の発話内
容の各フレームのパワーとを付けし、両者の差分をそれ
ぞれのフレームごとに求める。そして、各フレームごと
にパワーの差分が求められると、求められたそれぞれの
差分の和(たとえば、差分の2乗の和)を求め、この差
分の和の値に基づく評価値を求めて、その評価値によ
り、ユーザの発話内容のアクセントが適正か否かの評価
を行う。また、このとき、ステップs3と同様、Δ成分
(この場合は、Δパワー成分)を用いれば、より一層、
高精度な評価を行うことができる。
【0047】なお、このとき、ステップs3と同様に、
区間1、区間2、区間3のそれぞれの区間についても、
対応するフレーム間のパワーの差分を取り、その区間内
における差分の和を求めて、求められた差分の和の大き
さから区間ごとの評価値を求める。
【0048】また、パワーによる評価は以下に示すよう
な方法でにおいても評価を行うこともできる。
【0049】すなわち、パワーは図2(b),(f)に
示す曲線からもわかるように、時間方向に対してその大
きさが変化するが、パワーの極大値が得られる時刻(時
間軸上における位置)に重要性の高い部分的なアクセン
トが有ると判断して、パワーの極大値の時刻とそのパワ
ーの大きさを用いて、重要性の高い部分的なアクセント
の位置の評価を行うこともできる。この図2(b)の例
における2つの極大値m1,m2と、ユーザの発話内容
に対する極大値m11,m12(図2(f))を比較し
たとき、それぞれの極大値の時間的位置とその大きさが
比較的近いと判断されれば、高い評価値となる。
【0050】したがって、前述のパワーの差分の和から
求めた評価値による評価と、パワーの極大値とそのパワ
ーの大きさから求めた部分的なアクセントの位置の評価
を組み合わせれば、ある発話内容についてその発話内容
が適正なアクセントで発話されているか否かを適正に評
価できる。
【0051】次に、ピッチによる抑揚の評価について説
明する。これは、図1のステップs5における処理であ
る。
【0052】まず、前述のステップs3において音声特
徴ベクトルの対応付けを行うために用いたフレーム間の
対応関係を用いて、ユーザの発話内容の各フレームのピ
ッチと手本の発話内容の各フレームのピッチとを対応付
けし、両者を比較してその比較結果に基づいた評価値を
求める。
【0053】なお、このピッチに関しては、前述したよ
うに、すべてのフレームについて行う必要は必ずしもな
く、予め設定された区間のみを比較するようにしてもよ
い。
【0054】ここでの予め設定された区間というのは、
発話内容において特徴的な部分、たとえば、発話内容が
疑問文で有れば、尻上がりとなる最後のフレーズのみの
ピッチについてユーザの発話内容と手本の発話内容とを
比較する。
【0055】図2における「Are you ready ?」の
発話内容を例に取れば、区間3の「ready?」の部分に
ついて両者のピッチを比較する。
【0056】手本の発話内容から求められた区間3のピ
ッチ(図2(c))とユーザの発話内容から求められた
区間3のピッチ(図2(g))を比較すると、図2
(c)は尻上がりな変化となっているのに対し、図2
(g)は尻下がりな変化となっている。したがって、ユ
ーザの発話内容は、手本の発話内容に対して、「ready
?」の部分の抑揚が大きく異なると判断でき、これによ
り、ピッチに関する区間3の評価値は低い値となる。
【0057】次にユーザの発話した発話内容全体のテン
ポが手本の発話内容に対して適正か否かを評価する処理
について説明する。これは、図1のステップs6におけ
る処理である。
【0058】この発話内容全体のテンポが適正か否かを
判断する処理は、以下のようにして行う。
【0059】手本の3箇所の区切り点p1,p2,p3
に対応するユーザの区切り点p11,p12,p13を
求めたとき、ユーザの区切り点p11,p12,p13
と、手本の区切り点p1,p2,p3との時間的位置を
基にして、区間1、区間2、区間3の時間を比較するこ
とにより、区間ごとのテンポが適正か否か、あるいは、
その発話内容全体(区間1〜3)のテンポが適正か否か
を評価する。
【0060】具体的には、たとえば、手本の発話内容の
区切り点p1に対して、ユーザの発話内容の区切り点p
11の時間的位置が、時間的に早い位置、つまり、ユー
ザの区間1の時間T11が手本の区間1の時間T1より
少し短いとすると、区間1におけるテンポが手本に比べ
て少し速すぎるということが言える。したがって、この
場合の、区間1におけるテンポに関する評価値は少し低
い値となる。
【0061】この図2の例では、同図(d)と(h)を
比べると、ユーザの区間3の時間T13が手本の区間3
の時間T3よりかなり長く、区間3におけるテンポが手
本に比べて遅すぎるということが言える。同様にして、
各区間についても評価を行い、それぞれの区間における
評価値を求め、さらに、発話内容全体についての評価値
を求める。
【0062】また、テンポに関する評価については、前
述のように求められた、手本の音声の各区間の時間長の
比 T!:T2:T3 と、ユーザーの発話した音声の各
区間の時間長の比 T11:T12:T13 とを比較す
ることにより、評価値を求めることもできる。
【0063】以上のようにして、ユーザの発話した発話
内容における発音に関する評価として、区間1〜3につ
いての評価値と発話内容全体についての評価値とを求め
(ステップs3)、アクセントに関する評価として、区
間1〜3についての評価値と発話内容全体についての評
価値とを求め(ステップs4)、抑揚に関する評価とし
て、区間1〜3についての評価値と発話内容全体につい
ての評価値とを求め(ステップs4)、テンポに関する
評価として、区間1〜3についての評価値と発話内容全
体についての評価値とを求める(ステップs5)。な
お、この例では、抑揚については区間3のみについて評
価を行っている。
【0064】そして、これらの処理により得られた評価
値を基に、総合評価を行う(ステップs6)。たとえ
ば、発音に関しては、図3に示すように、区間1におけ
る評価値が0.8、区間2における評価値が0.9、区間3に
おける評価値が0.5、発話内容全体(区間1〜3)にお
ける評価値が0.7であったとする。また、アクセントに
関しては、区間1における類似度が0.7、区間2におけ
る評価値が0.9、区間3における評価値が0.7、発話内容
全体における評価値が0.8であったとする。また、抑揚
に関しては、区間3のみについて判断しているので、区
間3における評価値が0.3、発話内容全体における評価
値も0.3であったとする。また、テンポに関しては、区
間1における評価値が0.6、区間2における評価値が0.
8、区間3における評価値が0.4、発話内容全体における
評価値が0.6であったとする。
【0065】そして、これらの値をもとにユーザの発話
内容についての総合評価として、たとえば、0.5という
ような総合評価値(たとえば、0.1〜1.0まで0.1刻みの
評価値とする)で出される。
【0066】このような発音、アクセント、抑揚、テン
ポなどについて、各区間ごとの評価値、発話内容全体
(区間1〜3)の評価値、これらすべてを総合した総合
評価値は、ユーザに対して表示されるようになってい
る。
【0067】ユーザは、その表示結果を見ることによっ
て、「Are you ready ?」という発話内容全体の総
合評価値は「0.5」と比較的低い値であることがわか
り、また、発音、アクセント、抑揚、テンポについて、
どの区間がよくてどの区間が悪いかなど、発話内容につ
いてきめ細かな評価を知ることができる。
【0068】そして、ユーザは、このような評価結果を
踏まえて悪いところを注意しながら、同じ発話内容(こ
の場合、「Are you ready ?」)について、手本を
聴きながらなるべく手本と同じようになるように繰り返
し発話すると、段々と総合評価値が上昇して行き、たと
えば、2回目の総合評価値が0.7、3回目が0.9という具
合に総合評価値が段々と上昇して行く。そして、さら
に、数回繰り返して発話したとき、総合評価値が或る高
い値(たとえば、0,9)で一定となったとき、その発話
内容に関しては、発音、アクセント、抑揚、テンポなど
を総合して良好な発話がなされていると判断できる。こ
のように、1つの発話内容について何回も練習した結
果、総合評価値が或る高い価に収束するようになると、
良好な発話が行えるようになったと判断する。
【0069】なお、前記発音、アクセント、抑揚、テン
ポの4つの要素についてのそれぞれの評価値に重み付け
を行ってもよい。たとえば、ある発話内容に対して、発
音についての発話内容全区間(区間1〜区間3)の評価
値にw1という重みを掛け算し、アクセントについての
発話内容全区間(区間1〜区間3)の評価値にw2とい
う重みを掛け算し、抑揚についての発話内容全区間(区
間1〜区間3)の評価値にw3という重みを掛け算し、
テンポについての発話内容全区間(区間1〜区間3)の
評価値にw4という重みを掛け算して、それぞれ重み付
けをした評価値を算出したのち、総合評価値を出すよう
にしてもよい。これら、重みw1,w2,w3,w4
は、発音、アクセント、抑揚、テンポの4つの要素につ
いてそれぞれの重要度などにより予め決定しておく。こ
のような重み付けを行うことにより、より一層、適正な
評価を行うことができる。さらに、この重み付けは、発
音、アクセント、抑揚、テンポの4つの要素について各
区間ごとに行ってもよい。
【0070】ところで、手本の発話内容に対して、ユー
ザが異なる発話内容を入力してしまった場合も、場合に
よっては、総合評価値として比較的高い評価値が出てき
てしまう可能性もある。このような場合、前述した区切
り点の時間的位置を基に手本の発話内容内とは異なる発
話内容であることを判定する。
【0071】たとえば、手本の発話内容「Are you r
eady ?」に対してユーザが異なった発話をした場合、
図4に示すように、両者の音声波形は大きく異なったも
のとなり、たとえ、全体的なフレーム数にあまり大きな
差がなくても(例として、手本のフレーム数が70個、
ユーザの発話内容のフレーム数が80個とする)、手本
の区切り点p1,p2,p3に対応する区切り点をユー
ザの発話内容に対応させて無理矢理区切ると(区切り点
p11,p12,p13)、それぞれの区間1、区間
2、区間3の時間的な長さ(フレーム数)に大きな違い
の出る場合が多い。この図4の例では、区間1における
ユーザの発話時間が手本の約2倍となっている。
【0072】このように、手本の発話内容ごとに求めら
れている幾つかの区間に対して、ユーザの発話した発話
内容に時間的長さの大きく異なった区間(たとえば、2
倍以上の長さを有する場合など)が存在する場合は、ユ
ーザが手本の発話内容とは異なった発話内容を入力した
可能性が高いということを判定できる。
【0073】なお、以上説明した処理によっても、ユー
ザの発話する発話内容に対して信頼性の高い評価値を得
ることが可能であるが、話者正規化処理を行ったのち、
前述したそれぞれの評価値を求める処理を行うようにし
てもよい。
【0074】たとえば、予め話者適応用の数単語をユー
ザに発話してもらい、それにより得られた音声データと
手本が持っているその単語についての音声データとを基
にして変換関数を作成し、その変換関数を用いてユーザ
の音声を手本の音声側(あるいはその逆)にシフトして
話者正規化処理を行う。このような話者正規化を行った
のちに、前述したような評価値を求める処理を行えば、
より一層、高精度な評価が可能となる。
【0075】図5は以上説明した発話内容評価処理を行
うための装置構成例を示すもので、音声入力部1、入力
音声分析部2、手本音声データ記憶部3、変換関数作成
部4、変換関数記憶部5、話者正規化処理部6、発話評
価処理部7、評価結果出力部8などから構成されてい
る。
【0076】音声入力部1はマイクロホンやA/D変換
器などから構成され、ユーザの発話した音声を入力して
A/D変換する。また、入力音声分析部2は、ユーザの
発話した入力音声を分析して、音声特徴量としてのLP
Cケプストラム係数や、音声レベル、ピッチを各フレー
ムごとに求め、さらには、幾つかの区間を設定してそれ
ぞれ区間ごとの時間情報を求める。
【0077】また、手本音声データ記憶部3は、手本と
なる複数の発話内容それぞれについて、それぞれのフレ
ームごとのLPCケプストラム、パワー、ピッチ、各区
間ごとの時間情報などを記憶するものである。
【0078】また、変換関数作成部4は、ユーザの音声
特徴量と手本の音声特徴量を用いて変換関数を作成する
もので、これは前述したように、予め用意された数単語
を用いて予め変換関数を作成しておく。そして、その変
換関数を変換関数記憶部5に記憶させておく。
【0079】話者正規化処理部6は、変換関数記憶部5
に記憶されている変換関数を用いてユーザの音声の特徴
を手本の音声の特徴に近づける処理を行う。この話者正
規化処理を行うことで、ユーザの音声の話者性と手本の
音声の話者性との差を小さくすることができるため、そ
の後に行う発話評価処理をより一層高精度に行うことが
できる。
【0080】発話評価処理部7は、ユーザの音声データ
から得られた各フレームごとの音声特徴ベクトルと手本
の音声波形から得られた各フレームごとの音声特徴ベク
トルとを、DPマッチングを行ってそれぞれの特徴ベク
トル間の対応付けを行い、両者の距離を求め、その距離
を基に、発音の適正さを表す指標としての評価値を求め
るとともに、音声レベル情報を用いてアクセントについ
ての評価を行うための評価値を求め、さらに、ピッチ情
報を用いて抑揚の評価を行うための評価値を求め、さら
に、ユーザの発話した発話内容全体のテンポが手本の発
話内容に対して適正か否かを評価するための評価値を求
める処理を行う。
【0081】そして、この発話評価処理部7で求められ
た発音、アクセント、抑揚、テンポ、などに関するそれ
ぞれの評価値が求められると、評価結果出力部8により
求められた評価値を表示する。
【0082】なお、発話評価処理部7による評価値算出
処理とその具体的な評価値の例については既に説明した
ので、ここではその詳細な説明は省略する。
【0083】なお、この図4の構成は話者適応を行わせ
るために、変換関数作成部4、変換関数記憶部5、話者
適応化処理部6を設けた構成としたが、これは必ずしも
必要ではなく、これらを設けなくても本発明の所期の目
的は達成できるものである。
【0084】また、本発明は以上説明した実施の形態に
限定されるものではなく、本発明の要旨を逸脱しない範
囲で種々変形実施可能となるものである。たとえば、前
述の実施の形態では、発話の適正さを判断するに必要な
複数の要素として、発音、アクセント、抑揚、テンポの
4種類すべてを用いた例について説明したが、必ずしも
これらすべてを用いなくてもよい。たとえば、発音、ア
クセントのみを評価するといういこともでき、これにテ
ンポを加えるなど、それぞれの場合によって各要素を組
み合わせて用いることも可能である。しかし、これらす
べての要素を用いることによって、より一層、適正な発
話評価が可能となることは勿論である。
【0085】また、発音の評価を行うための音声の特徴
ベクトルの対応付けをDPマッチングを用いて行う例に
ついて説明したが、これは、DPマッチングに限られる
ものではなく、隠れマルコフモデル(HMM)や、ニュ
ーラルネットワークによるマッチングを用いることもで
きる。
【0086】また、以上説明した本発明の処理を行う処
理プログラムは、フロッピィディスク、光ディスク、ハ
ードディスクなどの記憶媒体に記憶させておくことがで
き、本発明はその記憶媒体をも含むものである。また、
ネットワークから処理プログラムを得るようにしてもよ
い。
【0087】
【発明の効果】以上説明したように、本発明によれば、
手本の持っているそれぞれの発話内容ごとに、発話の適
正さを判断するに必要な複数の要素に対するそれぞれの
音声データを予め求めて記憶させておき、話者(ユー
ザ)の発話した発話内容について、前記複数の要素に対
する音声データを求め、両者の音声データを、パターン
マッチングによる各フレーム間の対応付けを行って比較
することで、話者の発話評価を行うようにしている。こ
れにより、話者の発話に対して客観的な評価が可能とな
り、しかも、発話の適正さを判断するに必要な複数の要
素について評価するので、正確な評価を行うことができ
る。
【0088】また、この発明では、発話の適正さを判断
するための指標となる複数の要素として、発音、アクセ
ント、抑揚を用い、さらに、発話のテンポも用いている
ので、各国の言語に特有な発音、アクセント、抑揚、テ
ンポについてそれぞれ評価を行うことができ、それぞれ
の国の言語に適応した効率的な会話練習が可能となる。
【0089】また、その評価を行う際、ある1つの発話
内容において、各要素ごとの評価、その発話内容の各区
間ごとの評価、その発話内容全区間の評価、さらには、
これらを総合した総合評価も可能となり、話者は、自分
の発話について、評価の高い部分と評価の低い部分をき
め細かに知ることができ、効率のよい会話練習を行うこ
とができる。さらに、この発話評価を行う際、話者の音
声と手本の音声とを話者正規化処理を行ったのちに発話
評価処理を行うことにより、得られる評価値の信頼性を
より一層向上させることができる。
【0090】さらに、アクセントの評価を行う際、話者
のパワーと手本のパワーとをそれぞれのフレームごとに
差を取り、その差分を基にアクセントについての評価を
行う処理と、話者のパワーの極大値と手本のパワーの極
大値とを比較し、その時間的位置とそのパワーの大きさ
を基にアクセントについての評価を行う処理を組み合わ
せた処理を行うようにすることで、より一層、適正なア
クセントについての評価が可能となり、特に、話者のパ
ワーの極大値と手本のパワーの極大値とを比較すること
で、1つの発話内容全体のアクセントだけではなく、部
分的なアクセントについて評価することもでき、重要な
部分のアクセントについての練習を効率よく行うことが
できる。
【0091】加えて、前記話者の発話評価を行う際、話
者の音声と手本の音声とを話者正規化処理を行ったのち
に発話評価処理を行うことにより、得られる評価値の信
頼性をより一層向上させることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の発話評価処理手順を概略
的に説明するフローチャート。
【図2】本発明の実施の形態の発話評価処理を説明する
タイムチャート。
【図3】本発明の実施の形態において求められた評価値
の一例を示す図。
【図4】本発明の実施の形態において、ユーザが手本と
異なる発話内容を発話した場合の対処方法を説明する
図。
【図5】本発明の語学練習用発話評価装置の実施の形態
を示すブロック図。
【符号の説明】
1 音声入力部 2 入力音声分析部 3 手本音声データ記憶部 4 変換関数記憶部 5 変換関数記憶部 6 話者正規化処理部 7 発話評価処理部 8 評価結果出力部 p1,p2,p3 手本の発話内容の区切り点 p11,p12,p13 ユーザの発話内容の区切り点 T1,T2,T3 手本の発話内容における各区間の時
間情報 T11,T12,T13 ユーザの発話内容における各
区間の時間情報

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 手本の発話内容に従って発話した話者の
    音声を分析して得られたデータと前記手本の発話内容に
    対するデータとを比較して、話者の発話評価を行う語学
    練習用発話評価方法において、 手本の持っているそれぞれの発話内容ごとに、その発話
    内容についてそれぞれのフレームごとに音声分析し、発
    話の適正さを判断するに必要な要素に対するデータを予
    め求めておき、 話者の発話した発話内容についてそれぞれのフレームご
    とに音声分析し、前記発話の適正さを判断するに必要な
    要素に対するデータを求め、この話者のデータと前記手
    本のデータとを、パターンマッチングによる各フレーム
    間の対応付けを行ってそれぞれのデータ間を比較し、そ
    の比較結果に基づいて話者の発話評価を行うことを特徴
    とする語学練習用発話評価方法。
  2. 【請求項2】 前記発話の適正さを判断するに必要な複
    数の要素は、発音、アクセント、抑揚、発話のテンポで
    あって、これらの各要素のうち少なくとも1つを用い、 発音についての評価は、前記データとして話者の音声の
    特徴を表す音声特徴データと手本の音声の特徴を表す音
    声特徴データを用い、両者の音声特徴データをパターン
    マッチングによるフレーム間の対応付けを行って比較
    し、その比較結果を基に話者の発音についての評価を行
    い、 アクセントについての評価は、前記データとして話者の
    パワー情報と手本のパワー情報を用い、前記音声特徴デ
    ータの対応付けに用いられた各フレーム間の対応関係を
    用いて、話者と手本のパワー情報を対応づけて比較し、
    その比較結果を基にアクセントについての評価を行い、 抑揚についての評価は、前記データとして話者のピッチ
    情報と手本のピッチ情報を用い、前記音声特徴データの
    対応付けに用いられた各フレーム間の対応関係を用い
    て、話者と手本のピッチ情報を対応づけて比較し、その
    比較結果を基に抑揚についての評価を行い、 テンポについての評価は、手本の発話内容を幾つかに区
    切ることによって複数の区間を設定し、それぞれの区間
    における時間情報を求めておき、話者の発話内容に対し
    ても、前記パターンマッチングによるフレーム間の対応
    付けを用いて、前記手本の区切りに対応する区切りごと
    に区切って、それにより設定された区間ごとの時間情報
    を求め、前記手本における各区間ごとの時間情報と話者
    の対応する区間における時間情報とを比較し、その比較
    結果をもとに発話のテンポの評価を行うことを特徴とす
    る請求項1記載の語学練習用発話評価方法。
  3. 【請求項3】 前記アクセントについての評価を行う
    際、話者のパワーと手本のパワーとをそれぞれのフレー
    ムごとに差を取り、その差分を基にアクセントについて
    の評価を行う処理と、話者のパワーの極大値と手本のパ
    ワーの極大値とを比較し、その時間的位置とそのパワー
    の大きさを基にアクセントについての評価を行う処理の
    少なくとも1つの処理を行うことを特徴とする請求項2
    記載の語学練習用発話評価方法。
  4. 【請求項4】 前記話者の発話についての評価を行う
    際、手本の発話内容を幾つかに区切って複数の区間を設
    定し、話者の発話内容に対しても、前記パターンマッチ
    ングによるフレーム間の対応付けを用いて、前記手本の
    区切りに対応する区切りごとに区切って、それにより設
    定された区間ごとに、前記発話の適正さを判断するに必
    要な要素についての評価を行うとともに、全区間に渡っ
    て前記発話の適正さを判断するに必要な要素についての
    評価を行い、さらに、その発話内容全体に対する総合的
    な評価を行うことを特徴とする請求項1から3のいずれ
    かに記載の語学練習用発話評価方法。
  5. 【請求項5】 前記話者の発話評価を行う際、話者の音
    声と手本の音声に対して話者正規化処理を施したのち発
    話評価処理を行うことを特徴とする請求項1から4のい
    ずれかに記載の語学練習用発話評価方法。
  6. 【請求項6】 手本の発話内容に従って発話した話者の
    音声を分析して得られた音声データと前記手本の発話内
    容に対する音声データとを比較して、話者の発話評価を
    行う語学練習用発話評価装置において、 手本の持っているそれぞれの発話内容についてそれぞれ
    のフレームごとに求められた発話の適正さを判断するに
    必要な要素に対するデータを、それぞれの発話内容ごと
    に記憶する手本音声データ記憶部と、 話者の音声を入力する音声入力部と、 この音声入力部に入力された話者の発話した発話内容に
    ついて、それぞれのフレームごとに音声分析し、前記発
    話の適正さを判断するに必要な要素に対するデータをフ
    レームごとに求める入力音声分析部と、 この入力音声分析部により求められた話者のデータと前
    記手本のデータとを、パターンマッチングによるそれぞ
    れのフレーム間の対応付けを行ってデータ間を比較し、
    その比較結果に基づいて話者の発話についての評価を行
    う発話評価処理部と、 この発話評価処理部による評価内容に基づいた評価結果
    を出力する評価結果出力部と、 を有することを特徴とする語学練習用発話評価装置。
  7. 【請求項7】 前記発話の適正さを判断するに必要な要
    素は、発音、アクセント、抑揚、発話のテンポであっ
    て、これらの各要素のうち少なくとも1つを用い、 前記発話評価処理部が行う発音についての評価は、前記
    データとして話者の音声の特徴を表す音声特徴データと
    手本の音声の特徴を表す音声特徴データを用い、両者の
    音声特徴データをパターンマッチングによるフレーム間
    の対応付けを行って比較し、その比較結果を基に話者の
    発音についての評価を行い、 アクセントについての評価は、前記データとして話者の
    パワー情報と手本のパワー情報を用い、前記音声特徴デ
    ータの対応付けに用いられた各フレーム間の対応関係を
    用いて、話者と手本のパワー情報を対応づけて比較し、
    その比較結果を基にアクセントについての評価を行い、 抑揚についての評価は、前記データとして話者のピッチ
    情報と手本のピッチ情報を用い、前記音声特徴データの
    対応付けに用いられた各フレーム間の対応関係を用い
    て、話者と手本のピッチ情報を対応づけて比較し、その
    比較結果を基に抑揚についての評価を行い、 テンポについての評価は、手本の発話内容を幾つかに区
    切ることによって設定された複数の区間ごとの時間情報
    と、前記パターンマッチングによるフレーム間の対応付
    けにより前記手本の区切りに対応して区切られて設定さ
    れた話者の発話内容に対するそれぞれの区間ごとの時間
    情報とを比較し、その比較結果をもとに発話のテンポの
    評価を行うことを特徴とする請求項6記載の語学練習用
    発話評価装置。
  8. 【請求項8】 前記発話評価処理部は、アクセントにつ
    いての評価を行う際、話者のパワーと手本のパワーとを
    それぞれのフレームごとに差を取り、その差分を基にア
    クセントについての評価を行う処理と、話者のパワーの
    極大値と手本のパワーの極大値とを比較し、その時間的
    位置とそのパワーの大きさを基にアクセントについての
    評価を行う処理の少なくとも1つの処理を行うことを特
    徴とする請求項7記載の語学練習用発話評価装置。
  9. 【請求項9】 前記発話評価処理部は、手本の発話内容
    を幾つかに区切って複数の区間を設定し、話者の発話内
    容に対しても、前記パターンマッチングによるフレーム
    間の対応付けを用いて、前記手本の区切りに対応する区
    切りごとに区切って、それにより設定された区間ごと
    に、前記発話の適正さを判断するに必要な要素について
    の評価を行うとともに、全区間に渡って前記発話の適正
    さを判断するに必要な要素についての評価を行い、さら
    に、その発話内容全体に対する総合的な評価を行うこと
    を特徴とする請求項6から8のいずれかに記載の語学練
    習用発話評価装置。
  10. 【請求項10】 前記発話評価処理部の前段に、話者の
    音声と手本の音声に対して話者正規化処理を施す話者正
    規化処理手段を設け、この話者正規化処理手段により話
    者正規化処理を行ったのち、発話評価処理を行うことを
    特徴とする請求項6から9のいずれかに記載の語学練習
    用発話評価装置。
  11. 【請求項11】 手本の発話内容に従って発話した話者
    の音声を分析して得られたデータと前記手本の発話内容
    に対するデータとを比較して、話者の発話評価を行う発
    話評価処理プログラムを記憶した記憶媒体において、 前記発話評価処理プログラムは、 手本の持っているそれぞれの発話内容ごとに、その発話
    内容についてそれぞれのフレームごとに音声分析し、発
    話の適正さを判断するに必要な要素に対するデータを予
    め求めて記憶させておき、 話者の発話した発話内容についてそれぞれのフレームご
    とに音声分析し、前記発話の適正さを判断するに必要な
    要素に対するデータを求め、この話者のータと前記手本
    のデータとを、パターンマッチングによる各フレーム間
    の対応付けを行ってデータ間を比較し、その比較結果に
    基づいて話者の発話評価を行うことを特徴とする発話評
    価処理プログラムを記憶した記憶媒体。
JP9303202A 1997-11-05 1997-11-05 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 Pending JPH11143346A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9303202A JPH11143346A (ja) 1997-11-05 1997-11-05 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9303202A JPH11143346A (ja) 1997-11-05 1997-11-05 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11143346A true JPH11143346A (ja) 1999-05-28

Family

ID=17918120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9303202A Pending JPH11143346A (ja) 1997-11-05 1997-11-05 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11143346A (ja)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024139A1 (fr) * 1999-09-27 2001-04-05 Kojima Co., Ltd. Systeme d'evaluation de la prononciation
JP2002156897A (ja) * 2000-11-17 2002-05-31 Fuji Xerox Co Ltd 発音学習装置
JP2004053652A (ja) * 2002-07-16 2004-02-19 Asahi Kasei Corp 発音判定システム、システム管理用サーバ及びプログラム
JP2006171184A (ja) * 2004-12-14 2006-06-29 Toshiba Corp 技能評価システムおよび技能評価方法
JP2006201491A (ja) * 2005-01-20 2006-08-03 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227587A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227030A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227564A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 音響評定装置、およびプログラム
JP2006251721A (ja) * 2005-03-14 2006-09-21 Advanced Telecommunication Research Institute International 音響評定装置、音響出力装置およびそのプログラム
JP2006267465A (ja) * 2005-03-23 2006-10-05 Tokyo Electric Power Co Inc:The 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体
JP2006337667A (ja) * 2005-06-01 2006-12-14 Ntt Communications Kk 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。
JP2007147783A (ja) * 2005-11-24 2007-06-14 Yamaha Corp 語学学習装置
JP2008040344A (ja) * 2006-08-09 2008-02-21 Yamaha Corp 音声評価装置
US7401018B2 (en) 2000-01-14 2008-07-15 Advanced Telecommunications Research Institute International Foreign language learning apparatus, foreign language learning method, and medium
JP2010096961A (ja) * 2008-10-16 2010-04-30 Advanced Telecommunication Research Institute International 能力評価方法、および能力評価システムのサーバ
JP2010164971A (ja) * 2009-01-16 2010-07-29 Internatl Business Mach Corp <Ibm> 口語技能の評価
JP2010271615A (ja) * 2009-05-25 2010-12-02 Nintendo Co Ltd 発音評価プログラムおよび発音評価装置
US7941318B2 (en) 2007-10-01 2011-05-10 International Business Machines Corporation Public speaking self-evaluation tool
JP2011215643A (ja) * 2011-07-19 2011-10-27 Yamaha Corp 音声特徴量算出装置
KR101231037B1 (ko) * 2012-10-31 2013-02-07 김성렬 어학 발음 평가 방법 및 이를 이용한 어학 학습 시스템
WO2014002391A1 (ja) * 2012-06-29 2014-01-03 テルモ株式会社 情報処理装置および情報処理方法
CN103514765A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估方法
CN103514764A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估系统
JP2014240902A (ja) * 2013-06-11 2014-12-25 株式会社ジャストシステム 学習支援装置
JP2015011348A (ja) * 2013-06-26 2015-01-19 韓國電子通信研究院Electronics and Telecommunications Research Institute 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置
JP2016157097A (ja) * 2015-02-24 2016-09-01 ブラザー工業株式会社 音読評価装置、音読評価方法、及びプログラム
JP2017122880A (ja) * 2016-01-08 2017-07-13 ブラザー工業株式会社 音読評価装置、表示制御方法、及びプログラム
JP2017156614A (ja) * 2016-03-03 2017-09-07 ブラザー工業株式会社 対応付け編集装置、対応付け編集方法、及びプログラム
CN108922289A (zh) * 2018-07-25 2018-11-30 深圳市异度信息产业有限公司 一种用于英语口语的打分方法、装置及设备
CN109859548A (zh) * 2019-04-15 2019-06-07 新乡学院 一种大学普通话辅助教学设备
CN116343824A (zh) * 2023-05-29 2023-06-27 新励成教育科技股份有限公司 口才表达能力的全面评估与解决方法、系统、装置及介质

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024139A1 (fr) * 1999-09-27 2001-04-05 Kojima Co., Ltd. Systeme d'evaluation de la prononciation
US7401018B2 (en) 2000-01-14 2008-07-15 Advanced Telecommunications Research Institute International Foreign language learning apparatus, foreign language learning method, and medium
JP2002156897A (ja) * 2000-11-17 2002-05-31 Fuji Xerox Co Ltd 発音学習装置
JP2004053652A (ja) * 2002-07-16 2004-02-19 Asahi Kasei Corp 発音判定システム、システム管理用サーバ及びプログラム
JP2006171184A (ja) * 2004-12-14 2006-06-29 Toshiba Corp 技能評価システムおよび技能評価方法
JP2006201491A (ja) * 2005-01-20 2006-08-03 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227587A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227030A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 発音評定装置、およびプログラム
JP2006227564A (ja) * 2005-01-20 2006-08-31 Advanced Telecommunication Research Institute International 音響評定装置、およびプログラム
JP2006251721A (ja) * 2005-03-14 2006-09-21 Advanced Telecommunication Research Institute International 音響評定装置、音響出力装置およびそのプログラム
JP2006267465A (ja) * 2005-03-23 2006-10-05 Tokyo Electric Power Co Inc:The 発話状態評価装置、発話状態評価プログラム、プログラム格納媒体
JP2006337667A (ja) * 2005-06-01 2006-12-14 Ntt Communications Kk 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。
JP2007147783A (ja) * 2005-11-24 2007-06-14 Yamaha Corp 語学学習装置
JP2008040344A (ja) * 2006-08-09 2008-02-21 Yamaha Corp 音声評価装置
US7941318B2 (en) 2007-10-01 2011-05-10 International Business Machines Corporation Public speaking self-evaluation tool
JP2010096961A (ja) * 2008-10-16 2010-04-30 Advanced Telecommunication Research Institute International 能力評価方法、および能力評価システムのサーバ
JP2010164971A (ja) * 2009-01-16 2010-07-29 Internatl Business Mach Corp <Ibm> 口語技能の評価
US8775184B2 (en) 2009-01-16 2014-07-08 International Business Machines Corporation Evaluating spoken skills
JP2010271615A (ja) * 2009-05-25 2010-12-02 Nintendo Co Ltd 発音評価プログラムおよび発音評価装置
JP2011215643A (ja) * 2011-07-19 2011-10-27 Yamaha Corp 音声特徴量算出装置
WO2014002391A1 (ja) * 2012-06-29 2014-01-03 テルモ株式会社 情報処理装置および情報処理方法
KR101231037B1 (ko) * 2012-10-31 2013-02-07 김성렬 어학 발음 평가 방법 및 이를 이용한 어학 학습 시스템
JP2014240902A (ja) * 2013-06-11 2014-12-25 株式会社ジャストシステム 学習支援装置
JP2015011348A (ja) * 2013-06-26 2015-01-19 韓國電子通信研究院Electronics and Telecommunications Research Institute 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置
CN103514764A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估系统
CN103514765A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估方法
JP2016157097A (ja) * 2015-02-24 2016-09-01 ブラザー工業株式会社 音読評価装置、音読評価方法、及びプログラム
JP2017122880A (ja) * 2016-01-08 2017-07-13 ブラザー工業株式会社 音読評価装置、表示制御方法、及びプログラム
JP2017156614A (ja) * 2016-03-03 2017-09-07 ブラザー工業株式会社 対応付け編集装置、対応付け編集方法、及びプログラム
CN108922289A (zh) * 2018-07-25 2018-11-30 深圳市异度信息产业有限公司 一种用于英语口语的打分方法、装置及设备
CN109859548A (zh) * 2019-04-15 2019-06-07 新乡学院 一种大学普通话辅助教学设备
CN116343824A (zh) * 2023-05-29 2023-06-27 新励成教育科技股份有限公司 口才表达能力的全面评估与解决方法、系统、装置及介质
CN116343824B (zh) * 2023-05-29 2023-08-15 新励成教育科技股份有限公司 口才表达能力的全面评估与解决方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
JPH11143346A (ja) 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体
CN108496219B (zh) 语音处理系统和方法
US6366883B1 (en) Concatenation of speech segments by use of a speech synthesizer
Masuko et al. Imposture using synthetic speech against speaker verification based on spectrum and pitch.
Turk et al. Robust processing techniques for voice conversion
JP2002040926A (ja) インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法
Mouaz et al. Speech recognition of moroccan dialect using hidden Markov models
WO2001052237A1 (fr) Appareil, methode et support d&#39;apprentissage de langues etrangeres
JPH04362699A (ja) 音声認識方法及び装置
JP2955297B2 (ja) 音声認識システム
KR20080018658A (ko) 사용자 선택구간에 대한 음성비교 시스템
Mary et al. Evaluation of mimicked speech using prosodic features
Abdelmalek et al. High quality Arabic text-to-speech synthesis using unit selection
JP2006084966A (ja) 発話音声の自動評定装置およびコンピュータプログラム
Cahyaningtyas et al. Synthesized speech quality of Indonesian natural text-to-speech by using HTS and CLUSTERGEN
JP2806364B2 (ja) 発声訓練装置
Barczewska et al. Detection of disfluencies in speech signal
Hanani et al. Speech-based identification of social groups in a single accent of British English by humans and computers
JP4962930B2 (ja) 発音評定装置、およびプログラム
JP4236502B2 (ja) 音声認識装置
JP5066668B2 (ja) 音声認識装置、およびプログラム
Ahmed et al. Voice morphing: An illusion or reality
Torres et al. Parameter estimation and prediction from text for a superpositional intonation model
Chanjaradwichai et al. A multi model HMM based speech synthesis
Sigmund Search for keywords and vocal elements in audio recordings

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050711

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050809