JP2003186379A - 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム - Google Patents

音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム

Info

Publication number
JP2003186379A
JP2003186379A JP2001380679A JP2001380679A JP2003186379A JP 2003186379 A JP2003186379 A JP 2003186379A JP 2001380679 A JP2001380679 A JP 2001380679A JP 2001380679 A JP2001380679 A JP 2001380679A JP 2003186379 A JP2003186379 A JP 2003186379A
Authority
JP
Japan
Prior art keywords
voice
trainee
symbol
information
visualization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001380679A
Other languages
English (en)
Inventor
Tetsushi Takagi
哲史 高木
Akihiro Kimura
晋太 木村
Ichiro Hattori
一郎 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Animo Ltd
Original Assignee
Animo Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Animo Ltd filed Critical Animo Ltd
Priority to JP2001380679A priority Critical patent/JP2003186379A/ja
Publication of JP2003186379A publication Critical patent/JP2003186379A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】適切な発声発話訓練のために必要な情報を訓練
者に提供する。 【解決手段】基準音声を出力するための音声再生出力処
理と、例えば基準音声を発声している人物の動画像を表
示装置に表示するための動画像再生処理と、基準音声に
対応し且つ発声のタイミング、発声長、音程及び促音を
表す図形を表示し、少なくとも発声部分を図形の色を変
更することにより表示する図形表示処理とを実行する。
これにより、訓練者は単に音声及び動画像にて他人が話
しているのをまねするだけでなく、図形によりプロソデ
ィを知覚し、発声することができるようになる。すなわ
ち、効果的な訓練を行うことができるようになる。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、発声発話訓練のた
めの情報処理技術に関する。
【0002】
【従来の技術】従来から様々な方法で外国語習得希望者
や失語症患者をはじめとする言語障害者、構音障害者に
より発声発話訓練が行われていた。特に、失語症患者等
の発声発話訓練では、韻律を表す図形が予め印刷された
カードを先生が示しながら発声して、失語症患者等がそ
のまねをするといった方法や、手本となる音声データの
再生と予め用意された韻律を表す図形を表示するプログ
ラムを用いた発声発話訓練などが行われていた。
【0003】
【発明が解決しようとする課題】しかし、従来の技術に
よっては、必ずしも外国語習得希望者や失語症患者等に
よる効果的な発声発話訓練が可能ではなかった。すなわ
ち、教材の作成が簡単且つ柔軟に行うことができなかっ
たり、外国語習得希望者や失語症患者等に対し適切な発
声発話訓練のために必要な情報を提供できなかったり、
その能力に応じた訓練も可能となっていなかった。
【0004】従って、本発明の目的は、発声発話訓練の
ための教材データの作成を簡単且つ柔軟に行うための技
術を提供することである。
【0005】また、他の目的は、適切な発声発話訓練の
ために必要な情報を訓練者に提供可能とする技術を提供
することである。
【0006】さらに、他の目的は、訓練者の能力に応じ
た発声発話訓練を可能とする技術を提供することであ
る。
【0007】さらに、他の目的は、訓練者による発声発
話訓練の結果をより客観的に提示可能とする技術を提供
することである。
【0008】
【課題を解決するための手段】本発明の第1の態様は、
再生速度を動的に変更可能とする手段を含む発声者の動
画像及び音声の同期再生手段が組み込まれた発声発話訓
練装置である。これにより、訓練者の能力に併せて必要
な部分について適切な速度で動画像及び音声を再生する
ことができるようになる。
【0009】本発明の第2の態様に係るプログラムは、
入力音声データを取得し、記憶装置に格納するステップ
と、入力音声データから、少なくとも当該音声の発声
長、音程及び促音に対応する、発声練習のための音声可
視化パラメータを抽出し、記憶装置に格納する音声可視
化パラメータ抽出ステップと、音声可視化パラメータに
従って、発声のタイミング、発声長、音程及び促音につ
いての情報を図形化し、表示装置に表示する表示ステッ
プとをコンピュータに実行させるためのプログラムであ
る。これにより簡単に練習のための音声可視化パラメー
タを生成することができ、柔軟な教材作成が可能とな
る。
【0010】また、表示装置に表示された発声のタイミ
ング、発声長、音程及び促音についての情報を表す図形
を、修正指示に応じて修正して表示するステップと、修
正された図形の位置、長さ及び高さに応じて音声可視化
パラメータを変更し、記憶装置に格納するステップとを
さらにコンピュータに実行させるようにしてもよい。こ
れにより自動的に図形を生成した場合に、図形形状の修
正を簡単に行うことができるようになる。また、図形形
状の修正に応じて自動的に音声可視化パラメータを変更
することもできるようになる。
【0011】なお、上で述べた音声パラメータ抽出ステ
ップが、入力音声データの音声シンボル(例えば所定レ
ベル(例えば平均以上)の音圧強度を有する部分)を切
り出すステップと、切り出された各音声シンボルについ
て時間的な位置、長さ及びピッチについての情報を抽出
するステップと、入力音声データ中の促音部の位置を検
出するステップとを含むような構成であっても良い。
【0012】また、音声再生指示に応じて入力音声デー
タを再生処理するステップと、入力音声データの波形を
表示するステップとをさらにコンピュータに実行させる
ような構成であってもよい。これにより、より適切な図
形の修正を行うことができるようになる。
【0013】さらに、上で述べた表示ステップが、音声
可視化パラメータのうち発声長に関するパラメータによ
り図形の長さを決定するステップと、音声可視化パラメ
ータのうち音程に関するパラメータにより図形の高さを
決定するステップと、音声可視化パラメータのうち促音
に関するパラメータにより促音の図形の位置を決定する
ステップとを含むような構成であってもよい。
【0014】本発明の第3の態様に係るプログラムは、
基準音声を出力するための音声再生出力処理と、基準音
声を発声している人物の動画像を表示装置に表示するた
めの動画像再生処理と、基準音声に対応し且つ発声のタ
イミング、発声長、音程及び促音を表す図形を表示し、
当該図形の少なくとも発声部分の色を変更することによ
り表示する図形表示処理とをコンピュータに実行させる
ためのプログラムである。これにより、訓練者は単に音
声及び動画像にて他人が話しているのをまねするだけで
なく、図形によりプロソディを知覚し、発声することが
できるようになる。すなわち、効果的な訓練を行うこと
ができるようになる。
【0015】また、音声再生出力処理と動画像再生処理
と図形表示処理とを同期させるための同期処理をさらに
コンピュータに実行させるような構成であってもよい。
これにより、より自然な発声状態を再現し、適切な発声
部分を提示できるようになる。
【0016】なお、上で述べた図形表示処理が、基準音
声の少なくとも発声長、音程及び促音に対応する音声可
視化パラメータに従って、発声のタイミング、発声長、
音程及び促音についての情報を図形化する処理を含むよ
うな構成であってもよい。図形のデータとして保持する
のではなく音声可視化パラメータを保持することによ
り、再生速度の変更などに柔軟に対応することができる
ようになる。
【0017】さらに、基準音声の再生速度変更指示にお
いて指定された再生速度に従って、基準音声及び基準音
声を発声している人物の動画像の再生速度と、基準音声
に対応し且つ発声のタイミング、発声長、音程及び促音
を表す図形の形状と、当該図形の色の変更速度とを変更
するための速度変更処理をさらにコンピュータに実行さ
せるような構成であってもよい。これにより、訓練者の
状態に応じて適切な速度で訓練を実施することができる
ようになる。
【0018】また、上で述べた速度変更処理が、基準音
声の少なくとも発声長、音程及び促音に対応する音声可
視化パラメータを指定された再生速度に従って変更し、
記憶装置に格納する処理を含むような構成であってもよ
い。
【0019】また、上で述べた速度変更処理が、基準音
声のデータを指定された再生速度に従って変更し、当該
基準音声のデータの縮張内容に関する縮張情報を生成す
る処理と、生成された縮張情報を用いて、基準音声の少
なくとも発声長、音程及び促音に対応する音声可視化パ
ラメータを変更する処理とを含むような構成であっても
よい。
【0020】なお、速度変更処理を動的に実施するよう
にしてもよい。
【0021】また、上で述べた同期処理において、基準
音声の再生速度変更指示において指定された再生速度に
対応する縮張情報を用いて、発声のタイミング、発声
長、音程及び促音を表す図形の色の変更と、動画像の再
生とを、指定された再生速度に応じて変更された基準音
声の再生に同期させるための情報を生成するような構成
であってもよい。すなわち、音声再生をマスタとしてそ
の他の再生及び表示をスレーブとする構成である。
【0022】なお、訓練者は単に発声するだけでなく、
訓練者が発声した音声データを録音する処理をさらにコ
ンピュータに実行させるような場合もある。これにより
以下で説明するような評価処理を実施することができる
ようになる。
【0023】すなわち、基準音声の音声データから抽出
される所定のパラメータ(例えばLPCケプストラム係
数等)と訓練者の音声データから抽出される所定のパラ
メータとを用いて、訓練者が発声した音声と基準音声と
の類似度を分析する分析処理をさらにコンピュータに実
行させるような構成であってもよい。これにより、訓練
の達成度合いを見ることができるようになる。
【0024】さらに、訓練者が発声した音声のデータと
基準音声のデータとを所定の事項について比較可能な態
様にて表示すると共に、訓練者が発声した音声と基準音
声との類似度に関する情報を表示する処理をさらにコン
ピュータに実行させるようにしてもよい。これにより、
より訓練の達成度合いを評価することができるようにな
る。
【0025】また、上で述べた分析処理が、訓練者が発
声した音声データの音声シンボルと基準音声の音声デー
タの音声シンボルとの距離に関する情報を所定の方法で
算出し、記憶装置に格納する処理と、算出された距離に
関する情報を用いて、訓練者が発声した音声データの音
声シンボルと基準音声の音声データの音声シンボルとの
対応関係を検出する処理と、検出された対応関係を有す
る訓練者が発声した音声データの音声シンボルと基準音
声の音声データの音声シンボルとの距離に関する情報を
用いて、訓練者が発声した音声と基準音声との類似度に
関する情報を算出し、記憶装置に格納する処理とを含む
ような構成であってもよい。これにより客観的に達成度
を見ることができる。
【0026】本発明の第4の態様に係るプログラムは、
訓練者が発声した音声のデータと基準音声のデータとを
所定の事項について比較可能な態様にて表示する処理
と、訓練者が発声した音声のデータの音声シンボルと基
準音声の音声データの音声シンボルとの距離に関する情
報を所定の方法(例えば実施の形態におけるDP法)で
算出し、記憶装置に格納する処理と、算出された距離に
関する情報を用いて、訓練者が発声した音声データの音
声シンボルと基準音声の音声データの音声シンボルとの
対応関係を検出する処理と、検出された対応関係を有す
る訓練者が発声した音声データの音声シンボルと基準音
声の音声データの音声シンボルとの距離に関する情報を
用いて、訓練者が発声した音声と基準音声との類似度に
関する情報を算出し、表示装置に表示する処理とをコン
ピュータに実行させるためのプログラムである。これに
より、類似度等の客観的な数値と共に、波形や音声シン
ボル、ピッチやアクセント、フォルマント及びスペクト
ログラム等の音声のデータを比較することにより、発声
の内容を評価できるようになる。
【0027】また、本発明の第4の態様において、訓練
者が発声した音声のデータについて検出された対応関係
の個数(例えば実施の形態における音声マッチ数)に関
する情報を算出し、表示装置に表示する処理をさらにコ
ンピュータに実行させるような構成であってもよい。対
応関係の個数についても、訓練者の達成度を測るために
重要な指標となり得るものである。
【0028】さらに、上で述べた訓練者が発声した音声
と基準音声との類似度に関する情報が、少なくともスペ
クトル構造に関する類似度と音圧に関する類似度とのい
ずれかを含むような構成であってもよい。さらに、総合
的な類似度を含む場合もある。
【0029】なお、上記プログラムはコンピュータにイ
ンストールされるとコンピュータ・システムとなる。ま
た、上記プログラムは、例えばフレキシブル・ディス
ク、CD−ROM、光磁気ディスク、半導体メモリ、ハ
ードディスク等の記憶媒体又は記憶装置に格納される。
また、当該プログラムはネットワークを介して送信され
ることもある。なお、処理途中のデータについては、コ
ンピュータのメモリに一時保管される。
【0030】
【発明の実施の形態】図1に本発明の一実施の形態に係
る処理の概要を示す。最初に、訓練に用いる動画像(例
えば基準となる音声を発声している人物(特に顔の部
分)の動画像)及び基準となる音声のデータを取得して
記憶装置に格納すると共に、基準となる音声の可視化パ
ラメータ算出処理を実施する(ステップS1)。このよ
うに基準となる音声の可視化パラメータを算出すること
により、可視化が自動化されると共に可視化により表示
される音声可視化記号(又は図形)そのものを記録する
のではないため速度変更などによる音声可視化記号の変
更などに柔軟に対処できるようになる。なお、この音声
可視化記号は、音声の音声長、音程、促音を視覚的に訓
練者に提示するための音声波形の模式図である。以下、
失語症患者をはじめとする言語障害者、構音障害者の発
声発話訓練用の仕様を一例として説明する。失語症患者
は高次脳機能障害により認知障害等を併発するため、説
明を要しない直感的に理解可能な表現が必要とされてお
り、このための音声可視化記号についても以下で示す。
【0031】また、必ずしも自動的に生成した音声可視
化記号が適切ではない場合もあるので、確認を兼ねて、
音声可視化記号の修正処理を実施する(ステップS
3)。ユーザは、CAD(Computer Aided Design)等
の図形編集プログラムにより図形を編集するのと同様な
操作にて簡単に音声の可視化パラメータを修正すること
ができる。すなわち、直接可視化パラメータの数値を修
正することなく、より適切な可視化パラメータの設定を
実施することができるようになる。ここまでの処理は訓
練素材編集時に行われる前処理であって、訓練者ではな
く手本となるデータを生成する者の指示により実施され
る。
【0032】そして訓練者の指示に応じて、以上のよう
な前処理により生成された音声の可視化パラメータ及び
記憶装置に格納されている音声データ及び動画データと
を用いて、再生処理を実施する(ステップS5)。すな
わち、プロソディの視覚化と動画像及び音声との連動し
た訓練プレーヤを実現するものである。これにより、視
覚及び聴覚の強力なフィードバックにより、プロソディ
の知覚を促し、効果的な訓練手段を提供することができ
るようになる。この再生処理では、音声、動画像、そし
て音声の可視化パラメータから自動生成される音声可視
化記号とが同期して出力される。音声可視化記号につい
ては発声部分を明確にするために、音声出力に併せて色
が変更される。また、この再生処理では、訓練者の状態
に応じて再生速度を調整することができる。再生速度の
調整があっても訓練に支障が生じないよう、ピッチが変
わらないように音声データを変更し、当該音声データと
動画像データ並びに音声可視化記号の表示の同期を保つ
ための処理が実施される。また、訓練者の発声した音声
を録音しておき、次の分析処理を実施するようにしても
良い。
【0033】最後に、再生処理において録音された訓練
者の音声のデータ及び基準となる音声のデータを対比可
能な態様で表示すると共に、訓練者の音声と基準となる
音声との類似度等を所定の項目について算出するといっ
た分析処理を実施する(ステップS7)。音声のデータ
の対比としては、例えば波形、音声シンボル、ピッチ、
アクセント、フォルマント、スペクトログラムといった
観点において行われる。また、類似度等を計算する項目
としては、例えばスペクトル構造に関する比較点数、音
圧に関する比較点数、所定の基準を満たした音声シンボ
ルの数、総合的な比較点数などである。これにより、数
値により類似度等を客観的に示すと共に、音声の波形等
を並べて表示することにより、訓練の達成度を評価でき
るようになる。
【0034】図1の各ステップについて以下に詳しく述
べる。 1.可視化パラメータ算出処理(図1:ステップS1) 図2に可視化パラメータ算出処理のための機能ブロック
図を示す。訓練素材データ110としては、基準音声の
音声データ111と、例えば基準音声を発声している人
物の動画データ112とが含まれており、例えばHDD
(Hard Disk Drive)等の記憶装置に格納されている。
訓練素材データ110は、可視化パラメータ算出処理の
前に、通常のマイク等の音声入力手段及びデジタルビデ
オカメラ等の動画像入力手段により取得されたデータで
ある。ネットワークを介して取得する場合もある。基準
音声の音声データ111は、可視化パラメータ算出部1
01により処理され、基準音声の可視化パラメータ情報
102が生成され、記憶装置に格納される。
【0035】次に図3及び図4を用いて可視化パラメー
タ算出処理部101の処理を説明する。最初に、音声デ
ータ111を用いて音声全体における音圧の平均を算出
し、平均以上の音圧強度を有する部分を音声シンボルと
して切り出す(ステップS11)。例えば図4(a)の
ような音声データ111を処理する場合、図4(b)に
示すように平均以上の音圧強度を有する部分は、音声シ
ンボル41及び42となる。次に、各音声シンボルの位
置、長さ及びピッチ、並びにアクセント情報を音声デー
タ111から抽出し、記憶装置に格納する(ステップS
13)。なお、アクセント情報については音声可視化記
号の表示処理には直接は用いられないが、後の処理に用
いられるため、この段階にて抽出される。そして、各音
声シンボルについて、促音部の有無及びその位置を検出
し、記憶装置に格納する(ステップS15)。促音部の
検出の際には、促音と考えられる無音空隙部前後の音素
情報を音声認識にて統計解析し、確率的に空隙が促音で
あるか否かを判断する。上で抽出されたアクセント情報
を用いる場合もある。以上のようにして取得された各音
声シンボルの位置、長さ、ピッチ及び促音部についての
情報(有無及びその位置)並びにアクセント情報とを音
声可視化パラメータとしてファイルに格納する(ステッ
プS17)。可視化パラメータ算出としては本ステップ
にて処理を終了させても良いが、例えば確認のため、各
音声シンボルの位置、長さ及びピッチ、並びに促音部の
位置に従って音声可視化記号を表示装置に表示する(ス
テップS19)。図4(a)のような音声データを処理
する場合には、例えば図4(c)に示すような音声可視
化記号が表示されるようになる。すなわち、音声シンボ
ル41の位置、長さ及びピッチに応じて、記号43の位
置、長さ及び高さが決定され、音声シンボル42の位
置、長さ及びピッチに応じて、記号44の位置、長さ及
び高さが決定される。なお、別途検出された促音部につ
いては、検出された位置に記号45として表示される。
【0036】なお図示していないが、LPCケプストラ
ム係数についても後に用いられるので、可視化パラメー
タ算出処理部101が算出し、可視化パラメータ情報1
02に含める場合もある。なお、LPCケプストラム係
数の計算については、従来技術と何ら変わりないので、
ここで説明を省略する。
【0037】2.音声可視化記号修正処理(図1:ステ
ップS3) 図3に示した処理にて音声可視化パラメータを生成し、
当該音声可視化パラメータを処理することにより音声可
視化記号を自動的に表示させることができるが、必ずし
も適切な音声可視化記号が表示されない場合がある。従
って、自動生成された音声可視化記号の修正が必要とな
る。
【0038】この音声可視化記号の修正処理のための機
能ブロック図を図5に示す。記号修正処理部120に
は、音声再生部121と、音声可視化記号描画部123
と、可視化パラメータ編集部124とが含まれる。記号
修正処理部120は、ユーザからの指示入力104に応
じて処理を実施する。また、音声再生部121は音声デ
ータ111を再生出力するものである。音声可視化記号
描画部123は、可視化パラメータ情報102をそのま
ま用いて描画を行う場合もあれば、可視化パラメータ編
集部124により処理された可視化パラメータ情報を用
いて描画を行う場合もある。可視化パラメータ編集部1
24は、可視化パラメータ情報102をユーザからの指
示入力104に従って変更する処理を実施し、指示入力
104が保存を指示するものである場合には編集済み可
視化パラメータ情報103として記憶装置に格納するも
のである。
【0039】次に、図6及び7を用いて記号修正処理部
120の処理について説明する。図6は、ユーザが指示
入力104として記号修正処理部120の起動を指示し
た場合に表示される画面60の一例を示す。記号修正処
理部120は音声視覚化エディタと呼ばれ、この音声視
覚化エディタ画面には、音声可視化記号の表示部分61
と、音声波形データの表示部分62と、図形(音声可視
化記号)の追加ボタン63と、色の変更ボタン64と、
音声再生ボタン65と、自動生成ボタン66と、図形の
サイズ変更ボタン群67と、図形の位置変更ボタン群6
8と、図形の変更ボタン69と、図形の削除ボタン70
と、図形の全削除ボタン71と、グリッド線(補助線)
の設定部分72と、環境設定ボタン73と、保存指示ボ
タン74と、終了指示ボタン75とが設けられている。
【0040】音声再生部121は、音声波形データの表
示部分62に音声データ111の音声波形データの表示
処理を実施すると共に、再生ボタン65がクリックされ
た場合にはスピーカにて音声データ111の音声出力を
実施する。また、自動生成ボタン66がクリックされた
場合には、音声可視化記号描画部123は、可視化パラ
メータ情報102を用いて音声可視化記号の表示部分6
1に音声可視化記号を表示する。図形の追加ボタン6
3、色の変更ボタン64、サイズの変更ボタン群67、
位置の変更ボタン群68、図形の変更ボタン群69、削
除ボタン70又は全削除ボタン71がクリックされた場
合には、可視化パラメータ編集部124が指示に従って
可視化パラメータ情報102を変更し、変更後の可視化
パラメータ情報を音声可視化記号描画部123が処理し
て、音声可視化記号の表示部分61に表示する。なお、
色の変更ボタン64がクリックされた場合には、当該色
の情報も色の変更指示があった音声可視化記号に対応す
る音声シンボルの情報として登録される。但し、本発明
の要旨からは外れる部分であるのでここでは以下説明を
省略する。保存ボタン74がクリックされた場合には、
可視化パラメータ編集部124が、現在音声可視化記号
の表示部分61に表示されている音声可視化記号に応じ
た編集済み可視化パラメータ情報103を記憶装置に格
納する。グリッド線の設定部分72により設定がなされ
た場合には、音声可視化記号描画部123が音声可視化
記号の表示部分61に、設定に従ったグリッド線を描画
する。なお、音声波形データの表示部分62についても
グリッド線を描画するようにしても良い。環境設定ボタ
ン73がクリックされた場合には記号修正処理部120
により環境設定が行われ、終了ボタン75がクリックさ
れた場合には音声可視化エディタ画面60がクローズさ
れる。なお、音声データ111の再生時に動画データ1
12を共に再生するような構成であってもよい。
【0041】図7に記号修正処理部120の処理フロー
をまとめておく。記号修正処理部120は、ユーザから
の指示入力104が再生指示(再生ボタン65のクリッ
ク)であるか判断する(ステップS21)。もし、再生
指示である場合には、音声再生部121は音声データ1
11の再生出力を実施する(ステップS23)。再生指
示でない場合には、ユーザからの指示入力104が音声
可視化記号の自動生成指示(自動生成ボタン66のクリ
ック)であるか判断する(ステップS25)。もし、音
声可視化記号の自動生成指示である場合には、音声可視
化記号描画部123が可視化パラメータ情報102を用
いて音声可視化記号の描画処理を実施する(ステップS
27)。音声可視化記号の自動生成指示ではない場合に
は、図形の追加ボタン63、色の変更ボタン64、サイ
ズの変更ボタン群67、位置の変更ボタン群68、図形
の変更ボタン群69、削除ボタン70又は全削除ボタン
71がクリックされる等して、記号修正指示が入力され
たか判断する(ステップS29)。もし、記号修正指示
が入力された場合には、音声可視化記号描画部123が
記号修正指示に応じた修正後の音声可視化記号を表示装
置に表示する(ステップS31)。なお、記号修正指示
に応じて可視化パラメータ情報102を可視化パラメー
タ編集部124が変更し、当該変更後の可視化パラメー
タ情報102を用いて音声可視化記号描画部123が修
正後の音声可視化記号を描画するようにしても良い。す
なわち、音声可視化記号の位置の変更により音声シンボ
ル又は促音部の位置を変更し、音声可視化記号の高さの
変更により音声シンボルのピッチを変更し、音声可視化
記号の長さの変更により音声シンボルの長さを変更し、
音声可視化記号の追加・削除により音声シンボル又は促
音部の追加・削除が行われる。また、この段階において
は音声可視化記号描画部123が、音声可視化記号の変
形のみを実施するだけであっても良い。
【0042】記号修正指示ではないと判断された場合に
は、ユーザによる指示入力が保存指示(保存ボタン73
のクリック)であるか判断する(ステップS33)。も
し、保存指示である場合には、可視化パラメータ編集部
124は、表示中の音声可視化記号の位置、長さ及び高
さ、並びに促音部の位置に従う可視化パラメータ情報を
編集済み可視化パラメータ情報103として記憶装置に
保存する(ステップS35)。ステップS31において
既に修正指示に応じて可視化パラメータ情報が変更され
ている場合には、当該変更後の可視化パラメータ情報を
編集済み可視化パラメータ情報103とする。一方、ス
テップS31において音声可視化記号の変更のみを実施
している場合には、表示されている音声可視化記号の位
置、長さ及び高さ、並びに促音部の位置に従って可視化
パラメータ情報102を変更し、当該変更後の可視化パ
ラメータ情報を編集済み可視化パラメータ情報103と
する。そして、保存指示ではない場合又はステップS2
3、ステップS27、ステップS31又はステップS3
5の後に、処理終了の指示(終了ボタン75のクリッ
ク)がなされているか判断する(ステップS37)。も
し、終了指示である場合には、処理を終了して音声視覚
化エディタ画面60をクローズする。一方、終了指示で
はない場合には、ステップS21に戻る。
【0043】このような処理にて、音声可視化記号の時
間軸上の位置、長さ、高さ、促音部の有無及びその位置
を任意に変更可能となる。すなわち、より適切な音声可
視化記号を設定することができ、訓練者に対して提示可
能となる。なお、ユーザはグラフィカルなインターフェ
ースで音声可視化記号を修正するだけで、可視化パラメ
ータ情報の変更を自動的に行うことができるようにな
る。なお、音声可視化記号の変更は任意であるから、変
更を行わない場合もあり、その場合には可視化パラメー
タ情報102と編集済み可視化パラメータ情報103と
は同一である。
【0044】3.再生処理(図1:ステップS5) ここでは、可視化パラメータ算出処理及び音声可視化記
号修正処理にて用意された編集済み可視化パラメータ情
報103と、基準音声の音声データ111及び動画デー
タ112とを用いた再生処理について説明する。
【0045】再生処理における機能ブロック図を図8に
示す。図2と同様に訓練素材データ110には、動画デ
ータ112及び音声データ111が含まれる。再生速度
変換処理部130には、再生速度設定入力104により
指定された再生速度に従って動画データ112の動画の
フレーム数を変更するフレーム数変換部131と、再生
速度設定入力10により指定された再生速度に従って音
声データの再生速度を変更するための話速変換部132
と、話速変換部132に生成され且つ指定された再生速
度に対応する縮張情報133と、縮張情報133に従っ
て編集済み可視化パラメータ情報103に対してパラメ
ータ縮張処理を実施するパラメータ縮張部134とが含
まれる。再生・表示処理部140には、フレーム数変換
部131により出力される動画データ112のフレーム
を表示する動画描画部141と、話速変換部132から
出力される音声データを再生する音声再生部142と、
話速変換部132が生成した縮張情報133に基づい
て、音声再生に動画再生及び音声可視化記号表示を同期
させるための同期信号146a及び146bを生成する
ための同期信号生成部143と、パラメータ縮張部13
4により処理された編集済み可視化パラメータ情報10
3を表示装置に表示する音声可視化記号描画部144
と、訓練中に訓練者が発声した音声を録音する訓練者音
声録音部145とが含まれる。なお、動画描画部141
と音声可視化記号描画部144は、コンピュータの処理
負荷の問題等から音声再生に同期できない場合もあり、
その場合には音声再生部142に補助信号147a及び
147bを出力して、音声再生部142の音声出力を停
止させることにより、音声再生、動画再生、及び音声可
視化表示を同期させる。訓練者音声録音部145により
録音された訓練者収録音声データ105は記憶装置に格
納される。また、再生・表示処理部140には訓練者か
ら指示入力148が入力され、指示入力148に従って
処理が実行される。
【0046】再生速度設定入力104に従った動画デー
タのフレーム数変換処理は周知の技術でありここでは詳
しく述べない。但し、フレーム数変換部131は所定の
フレーム毎にマークを付しておき、動画描画部141は
同期信号生成部143により生成される同期信号146
aに同期させてマークが付されたフレームを再生するよ
うに動作する。再生速度設定入力104に従った話速変
換部142による音程の変化を生じさせない話速変換処
理は、例えばピッチ−シンクロナス−オーバーラップ−
アッド(Pitch-Synchronous-Overlap-Add)法を用いる
ことにより実施することができる。なお、この方法は周
知であり、例えば、Eric Moulines andFrancis Charpen
tier:"PITCH-SYNCHRONOUS WAVEFORM PROCESSING TECHNI
QUES FOR TEXT-TO-SPEECH SYNTHESIS USING DIPHONES",
Speech Communication 9(1990)pp.453-467を参照のこ
と。なお、動画や音声の再生速度の変更については、例
えば特開2001−290500号公報、特開平11−
88844号公報、特開平9−248563号公報など
多数の文献に記載されており、ここでは詳しく述べな
い。
【0047】話速変換部132は、縮張情報133も生
成する。この縮張情報133には、縮張の方法及び縮張
の程度に関する情報を含む。例えば、再生速度設定入力
において指定された速度(例えば0.7倍)に応じた縮
張を線形に実施する場合には、線形という情報とその割
合(例えば70%)といった情報である。また、無音区
間を削除して再生速度を変更することも可能である。こ
の場合に縮張情報は例えば不連続という情報と縮張の割
合(例えば70%)という情報である。パラメータ縮張
部134は、縮張情報133を受け取ると、編集済み可
視化パラメータ情報103の音声可視化記号の位置及び
長さを縮張情報133に従って変更する。例えば線形と
いう情報と70%という情報を縮張情報133として取
得した場合には、パラメータ縮張部134は全体が70
%の長さになるように音声シンボルの位置や長さ、並び
に促音部の位置を線形に変更する。無音区間を削除する
場合も、音声シンボル間を無くし、その上で例えば全体
が70%の長さになるように音声シンボルの位置や長
さ、並びに促音部の位置を変更する。
【0048】縮張情報133は、再生速度設定入力10
4が入力されると直ぐに話速変換部132にて生成さ
れ、パラメータ縮張部134及び同期信号生成部143
に出力される。これにより、音声再生速度の動的な変更
が可能になる。すなわち、一つの基準音声の再生途中で
あっても、再生速度の変更を実施することができる。
【0049】音声可視化記号描画部144は、最初にパ
ラメータ縮張部134から受け取った可視化パラメータ
情報に基づき音声可視化記号全体を表示装置に表示す
る。また、訓練者に発声部分を認識させるため、既に音
声が出力されている部分について音声可視化記号の色を
変更する。この具体的な表示例については後に説明す
る。なお、この音声可視化記号の色の変更描画処理につ
いては、同期信号生成部146bの同期信号に従って行
われる。このようにして、音声再生と、動画再生及び音
声可視化記号の色の変更描画処理は同期が取られる。
【0050】図9に再生・表示処理部140による画面
表示例を示す。再生・表示処理部140は訓練プレイヤ
ーと呼ばれ、この訓練プレイヤー画面89には、動画像
表示部90と、音声可視化記号表示部92と、訓練用デ
ータ一覧を表示するための一覧ボタン93と、再生の制
御を行うボタン群94と、訓練全体のナビゲーションを
指示するためのナビボタン95と、再生の一時停止を行
うためのボタン96(図9では一時停止中であるため
「手本再開」と表示されている)と、訓練を開始し、訓
練者が発声した音声の録音を開始するための練習ボタン
97と、後に説明する分析処理に移行するための分析ボ
タン98と、再生速度の変更を行うための速さボタン9
9と、ヘルプ画面を表示するための取り決めごとボタン
100とが含まれる。
【0051】動画描画部141の描画結果は動画像表示
部90に表示される。また、音声可視化記号描画部14
4の描画結果は音声可視化記号表示部92に表示され
る。再生の制御を行うボタン群94や一時停止を行うた
めのボタン96の操作に従って、動画再生、音声再生、
音声可視化記号の色の変更処理は制御される。この処理
については通常の動画像再生処理などと同様であるから
説明を省略する。また、訓練者が発声した音声の録音を
開始するための練習ボタン97がクリックされた場合に
は、訓練者音声録音部145が訓練者が発声した音声の
録音を開始し、訓練者収録音声データ105を記憶装置
に格納する。この処理も従来と変わらないのでこれ以上
述べない。訓練者収録音声データ105が生成され、分
析ボタン98がクリックされると、後の述べる分析処理
が実施される。速さボタン99がクリックされると、例
えば図10のようなウインドウが表示される。ここで
は、再生速度を通常の再生速度に対する割合(%)の数
値にて入力欄1001に入力しても良いし、数値バー1
002のつまみ1002aを移動させて通常の再生速度
に対する割合の数値を入力するようにしても良い。更新
ボタン1003がクリックされると、再生速度設定入力
104として話速変換部132及びフレーム数変換部1
31に入力される。閉じるボタン1004がクリックさ
れると、図10のウインドウがクローズされる。
【0052】音声可視化記号表示部92に表示される音
声可視化記号は、音声の再生に併せて、発声部分を明示
するための色が変更されるようになっている。例えば図
11(a)乃至(f)に示すように、音声可視化記号は
左から順番に、発声部分を明示するために再生済みの部
分に色が塗られてゆく。これにより、聴覚と共に視覚上
においても再生位置の進行を知覚することができ、音声
可視化記号と音声及び動画との対応関係を認識しやすく
なる。なお、発声部分のみについて色の変更を実施する
ことも可能である。この色の変更の速度も、音声再生及
び動画再生に同期するようになっている。また、図10
のウインドウにて再生速度の変更がなされれば、音声可
視化記号の形状も、指定された再生速度の変更に応じて
変更され、さらに色の変更速度も音声再生に同期される
ので変更される。
【0053】以上説明した再生速度変換処理部130及
び再生・表示処理部140の処理フローを図12にまと
めておく。再生速度変換処理部130は、例えば図10
に示すようなウインドウからの再生速度設定入力104
を受け付け、再生速度設定情報を取得する(ステップS
41)。なお、変更がない場合には、通常の再生速度の
設定がなされたものとする。次に、話速変換処理部13
2は、再生速度設定情報に従って話速変換処理を実施す
る(ステップS43)。この話速変換処理は、上で述べ
たように例えばPitch-Synchronous-Overlap-Add法によ
り実施される。なお、変更がない場合には処理を行わな
いようにしても良い。一方、フレーム数変換部131
は、再生速度設定情報に従って動画データ112のフレ
ーム数変換処理を実施する(ステップS45)。この処
理についても従来と変わらないのでこれ以上述べない。
なお、再生速度の変更がない場合には処理を行わないよ
うにしても良い。そして、話速変換処理部132は、再
生速度設定情報に従って縮張情報133を生成する(ス
テップS47)。すなわち、縮張の方法及び縮張の度合
いを示す情報を生成する。なお、縮張の方法については
例えば線形のみの場合には、縮張情報133に含める必
要はない。
【0054】また、縮張情報133に基づいて、パラメ
ータ縮張部134は、編集済み可視化パラメータ情報1
03に対してパラメータ縮張処理を実施する(ステップ
S51)。すなわち、縮張情報133に基づいて、音声
シンボルの位置及び長さ、促音部の位置を変更する。な
お、再生速度の変更がない場合には、処理を行わなくと
も良い。
【0055】そして、話速変換処理部132により生成
された縮張情報133に基づいて、同期信号生成部14
3は動画描画部141に対する同期信号146aと、音
声可視化記号描画部144に対する同期信号146bと
を生成する(ステップS49)。この同期信号は、例え
ば所定の周期で生成されるものである。また、音声再生
部142が音声再生処理を実施し(ステップS53)、
同期信号146bに応じて音声可視化記号描画部144
は音声可視化記号描画処理を実施し(ステップS5
5)、同期信号146aに応じて動画描画部141は動
画描画処理を実施する(ステップS57)。ステップS
55及びステップS57においては、処理負荷等により
同期信号に従って表示を行えない場合が生じ得るため、
音声可視化記号描画部144又は動画描画部141が補
助信号147a又は147bを音声再生部142に対し
て出力し、音声再生を一時停止させることにより同期を
とる場合もある。
【0056】なお、音声可視化記号描画部144による
音声可視化記号描画処理においては、パラメータ縮張部
134により縮張された可視化パラメータ情報に基づき
すべての音声可視化記号を最初に表示し、発声部分を明
確にするため音声再生に従って再生済み部分の色を変更
する処理を実施する。この記号の色を変更する処理が音
声再生及び動画再生と同期される。
【0057】訓練者は、音声再生、動画再生及び音声可
視化記号の色の変更処理中であっても再生速度の変更を
行うことができる。従って、再生中であっても、再生速
度変換処理部130は再生速度設定入力104を受け取
ったか監視している。従って、処理が終了するまでステ
ップS41乃至S57が繰り返される(ステップS5
9)。
【0058】なお、図12には示されていないが、訓練
者が練習ボタン97をクリックすれば訓練者が発声した
音声が訓練者音声録音部145にて録音され、訓練者収
録音声データ105として記憶装置に格納される。この
訓練者収録音声データ105は、以下で説明する分析処
理にて使用される。
【0059】以上説明したように、訓練者は、音声、動
画及び音声可視化記号により視覚的及び聴覚的に刺激を
受けて、発声訓練のために必要な適切な情報を取得しつ
つ、効果的な発声訓練を行うことができるようになる。
なお、動画の再生がない場合も生じ得る。
【0060】4.分析処理(図1:ステップS7) 分析処理は、訓練者の達成度を分析して、客観的に提示
するための処理である。分析処理の機能ブロック図を図
13に示す。分析素材データ150には、基準音声の音
声データ111と、訓練者収録音声データ105とが含
まれる。また、評価診断処理部160には、訓練者収録
音声データ105に対して可視化パラメータ算出処理を
実施する可視化パラメータ算出部161と、訓練者の可
視化パラメータ情報162と、基準音声の可視化パラメ
ータ情報106と訓練者の可視化パラメータ情報162
と用いて比較分析処理を実施する比較分析部163とが
含まれる。結果表示処理部170には、訓練者収録音声
データ105と可視化パラメータ算出部161により算
出された可視化パラメータ情報とを用いて訓練者の音声
情報を表示する訓練者音声情報描画部171と、基準音
声の音声データ111と基準音声の可視化パラメータ情
報106とを用いて基準音声の音声情報を表示する基準
音声情報描画部172と、比較分析部163による比較
分析結果を表示する分析結果表示部173とが含まれ
る。
【0061】可視化パラメータ算出部161は、可視化
パラメータ算出部101と同様であって、各音声シンボ
ルを切り出し、各音声シンボルについて位置、長さ及び
ピッチ、並びにアクセント情報及びLPCケプストラム
係数を抽出し、記憶装置にファイルとして格納する。分
析処理の段階においては、訓練者収録音声データ105
に対して可視化パラメータ算出処理を実施し、訓練者の
可視化パラメータ情報162を生成する。比較分析部1
63は、基準音声の可視化パラメータ情報106(=編
集済み可視化パラメータ情報103)と訓練者の可視化
パラメータ情報162とを用いて、比較分析処理を実施
し、訓練者の音声と基準音声との類似度等を数値にて算
出する。
【0062】結果表示処理部170に含まれる訓練者音
声情報描画部171と基準音声情報描画部172は、訓
練収録音声データ105及び可視化パラメータ算出部1
61から得られる例えば訓練者の音声波形、音声シンボ
ル、ピッチ、アクセント、フォルマント及びスペクトロ
グラムと、基準音声の音声データ111及び基準音声の
可視化パラメータ情報106から得られる例えば基準音
声の音声波形、音声シンボル、ピッチ、アクセント、フ
ォルマント及びスペクトログラムとを、対比可能な態様
で表示装置に表示する。また、分析結果表示部173
は、比較分析部163が算出した基準音声と訓練者の音
声との類似度等の数値及び対応する評価情報などを表示
装置に表示する。
【0063】図14に結果表示処理部170により表示
された画面例を示す。当該分析結果を表示する画面に
は、基準音声と訓練者音声の音声波形を色を変えて(図
14では色は変えていない)重ねて表示する表示部分1
400と、基準音声と訓練者音声の音声シンボルの対応
関係を表示するための表示部分1401と、基準音声と
訓練者音声のピッチを色を変えて(図14では色は変え
ていない)重ねて表示する表示部分1402と、基準音
声と訓練者音声のアクセントを色を変えて(図14では
色は変えていない)重ねて表示する表示部分1403
と、波形、音声シンボル、ピッチ、アクセント、フォル
マント、スペクトログラムのいずれの情報を表示するか
を指示するためのチェックボックス群1404と、比較
分析部163の分析結果を表示するための分析結果表示
部分1404と、基準音声と訓練者音声又は基準音声の
み又は訓練者音声のみの情報を表示するか選択するため
のコンボボックス1407と、基準音声の再生を行うた
めの手本音声ボタン1406と、訓練者音声の再生を行
うための練習音声ボタン1408と、表示部分1400
乃至1403の再表示を指示するための再表示ボタン1
409と、図14のウインドウを閉じるための閉じるボ
タン1410とが含まれる。なお、図示の都合上フォル
マント及びスペクトログラムについての表示部分につい
ては省略されている。また、表示部分1400には、基
準音声の音声波形1400aと、訓練者音声の音声波形
1400bとが表示される。表示部分1402には、基
準音声のピッチ1402aと訓練者音声のピッチ140
2bとが表示される。さらに、表示部分1403には、
基準音声のアクセント1403aと訓練者音声のアクセ
ント1403bとが表示される。
【0064】音声波形の表示については、訓練者収録音
声データ105及び基準音声の音声データ111を用い
て行うことができる。音声シンボルの表示については、
基準音声の可視化パラメータ情報106に含まれる音声
シンボルの情報及び訓練者可視化パラメータ情報162
に含まれる音声シンボルの情報を用いて行うことができ
る。ピッチの表示については、基準音声の可視化パラメ
ータ情報106に含まれるピッチの情報及び訓練者可視
化パラメータ情報162に含まれるピッチの情報を用い
て行うことができるし、訓練者収録音声データ105及
び基準音声の音声データ111を用いても行うことがで
きる。アクセントの表示については、基準音声の可視化
パラメータ情報106に含まれるアクセント情報(音声
可視化には直接用いられていない)及び訓練者可視化パ
ラメータ情報162に含まれるアクセント情報を用いて
行うことができる。フォルマント及びスペクトログラム
の表示については、訓練者収録音声データ105及び基
準音声の音声データ111を用いて行うことができる。
これらの単純な表示については従来と同じであるからこ
れ以上述べない。
【0065】分析結果表示部分1404には、総評の点
数とコメント、「手本に沿った発声」といった事項につ
いての点数とコメント、「発声内容(スペクトル包絡構
造の近似)」といった事項についての点数及びコメン
ト、「発声のアクセント(音圧の近似)」といった事項
についての点数及びコメントが含まれる。
【0066】次に評価診断処理部160及び結果表示処
理部170の処理フローを図15乃至図17を用いて説
明する。まず、可視化パラメータ算出部161は、訓練
者収録音声データ105に対して可視化パラメータ算出
処理を実施し、生成される訓練者の可視化パラメータ情
報162を記憶装置に格納する(ステップS65)。こ
こでは、図3に示した処理及びLPCケプストラム係数
の計算を実施する。そして、比較分析部163は、基準
音声の可視化パラメータ情報106と訓練者の可視化パ
ラメータ情報162とを用いて比較分析処理を実施し、
分析結果を記憶装置に格納する(ステップS67)。こ
の処理については図16を用いて詳細に説明する。そし
て、分析結果表示部173は、比較分析部163による
比較分析処理の結果を表示装置に表示する(ステップS
69)。さらに、訓練者音声情報描画部171及び基準
音声情報描画部172は、訓練者収録音声データ105
及び訓練者の可視化パラメータ情報162、基準音声の
音声データ111及び基準音声の可視化パラメータ情報
106を用いて、例えばチェックボックス群1404に
おいて指定された項目についての音声のデータを、基準
音声と訓練者音声とを対比可能な態様で表示装置に表示
する(ステップS71)。
【0067】このようにすることにより図14のような
表示がなされ、訓練者や訓練者を指導する者は、訓練者
の達成度を数値や音声データの様々な側面で判断するこ
とができるようになる。
【0068】次に、図16を用いて比較分析処理の詳細
を説明する。比較分析部163は、訓練者の音声シンボ
ルを、時間軸上で早い時間に発声されたものから順に1
つ選択する(ステップS73)。そして、選択された訓
練者の音声シンボルに対し、時間軸上で所定の範囲内
(所定の閾値以内)の位置にある基準音声の音声シンボ
ルを検出する(ステップS75)。そして、この検出さ
れた基準音声の音声シンボルを順に一つ選択する(ステ
ップS77)。DP法により、選択された訓練者の音声
シンボルと、検出され且つ選択された基準音声の音声シ
ンボルとの距離を算出し、記憶装置に格納する(ステッ
プS79)。なお、DP法は周知でありここでは詳しく
述べない。距離については、LPCケプストラム係数に
より算出されるスペクトル構造の距離と、平均音圧の距
離と、シンボルの長さの距離である比較長とが含まれ
る。そして、各比較点数を、算出された距離の情報を用
いて算出する(ステップS81)。各比較点数とは、ス
ペクトル構造の比較点数、音圧の比較点数、総合比較点
数であり、例えば以下の式で算出される。なお、aから
mは定数である。 重み付き比較長=(exp(比較長×j)−k)×m スペクトル構造の比較点数=(h−スペクトル構造の距
離/重み付き比較長)×i 音圧の比較点数=(g−音圧の距離/比較長)×h 音圧比較重み付きのスペクトル構造=スペクトル構造の
比較点数×log(音圧の比較点数×d+e)×f 総合比較点数=音声比較重み付きのスペクトル構造比較
×a+音圧の比較点数×b 算出された各比較点数を音声シンボル毎に、後の使用の
ために記憶装置に格納する(ステップS83)。
【0069】比較分析部163は、ステップS77乃至
S83を、ステップS75において検出された基準音声
の音声シンボル全てについて比較点数の算出が行われる
まで実施する(ステップS85)。すなわち、検出され
た基準音声の音声シンボル全てについて比較点数の算出
が行われていない場合にはステップS77に戻り、検出
された基準音声の音声シンボル全てについて比較点数の
算出がなされた場合には、ステップS87に移行する。
ステップS87では、算出した総合比較点数のうち最大
の値を有する基準音声の音声シンボルを、選択された訓
練者の音声シンボルに対応するものとして対応関係を記
憶装置に格納し、音声マッチ数を1インクリメントし、
現音声マッチ数を記憶装置に格納する(ステップS8
7)。これにより訓練者の音声シンボルと基準音声の音
声シンボルとの対応関係がわかり、その音声シンボルの
対応関係に応じたスペクトル構造の比較点数、音圧の比
較点数及び総合比較点数が確定する。
【0070】例えば、図17(a)は基準音声の音声波
形を示し、図17(b)は基準音声の音声シンボルを示
し、図17(c)は訓練者音声の音声波形を示し、図1
7(d)は訓練者音声の音声シンボルを示している。こ
こでは基準音声の音声シンボル1701と訓練者音声の
音声シンボル1702とが対応している。例えば訓練者
音声の音声シンボル1703に対し、基準音声の音声シ
ンボル1701及び基準音声の音声シンボル1703が
時間軸上において所定の範囲内に入るためステップS7
7乃至ステップS83の処理がなされる。しかし、基準
音声の音声シンボル1701についての総合比較点数が
基準音声の音声シンボル1703についての総合比較点
数より大きい値を有するので、訓練者音声の音声シンボ
ル1702に対応する基準音声の音声シンボルは170
1となる。
【0071】そして、全ての訓練者の音声シンボルにつ
いて処理を行ったか判断する(ステップS89)。処理
が行われていない訓練者の音声シンボルがある場合には
ステップS73に戻る。また、全ての訓練者の音声シン
ボルについて処理が実施されていれば、各音声シンボル
から算出された比較点数の平均を比較点数の種類毎に算
出し、記憶装置に格納する。また、各比較カテゴリの評
価を決定する(ステップS91)。例えば、「手本に沿
った発声」というカテゴリについては、「音声マッチ数
/基準音声の音声シンボル個数」の値を計算し、例えば
0−40%については「いまひとつです」という評価を
割り当て、41−70%については「まずまずです」と
いう評価を割り当て、71%−100%については「良
好です」という評価を割り当てる。このカテゴリによ
り、訓練者が基準音声に対して積極的に発声しているか
判断できる。このカテゴリは図14の表示部分1401
にも表れている。
【0072】また、「発声内容(スペクトル包絡構造の
近似)」というカテゴリについては、スペクトル構造の
比較点数の平均値に基づき、例えば0/100−40/
100については「いまひとつです」という評価を割り
当て、41/100−70/100については「まずま
ずです」という評価を割り当て、71/100−100
/100については「良好です」という評価を割り当て
る。このカテゴリにより、明朗な話し声であるかといっ
た判断ができる。この数値が高ければ訓練者の話す声が
基準音声に近いことになる。従って、この比較点数は訓
練者の向上度合いの尺度となる。なお、このカテゴリ
は、フォルマント及びスペクトログラムに関連してい
る。
【0073】さらに、「発声のアクセント(音圧の近
似)」というカテゴリについては、音圧の比較点数の平
均値を基づき、例えば0/100−40/100につい
ては「いまひとつです」という評価を割り当て、41/
100−70/100については「まずまずです」とい
う評価を割り当て、71/100−100/100につ
いては「良好です」という評価を割り当てる。このカテ
ゴリにより、訓練者音声の音量が基準音声の音量に近い
かといったことを判断することができる。なお、スペク
トル構造の比較点数との関連で、音圧の比較点数に比べ
て、スペクトル構造の比較点数が低い場合には、訓練者
の音声は第三者にとって判別しにくい傾向があり、基準
音声どおりの内容を性格に話せていない可能性があるこ
とがわかる。また、スペクトル構造の比較点数に比べて
音圧の比較点数が低い場合には、訓練者は基準音声の内
容を良好に発声しているが、それに比較すると音量が少
ないことを判断することができる。
【0074】以上のような処理を実施することにより、
訓練者及び訓練者の指導者は、訓練者の発声の状態を客
観的に認識することができ、更なる練習及び指導を効果
的に実施できるようになる。
【0075】以上本発明の一実施の形態を説明したが、
本発明はこれに限定されない。例えば、上では失語症患
者等のためのシステムを開示しているが、本発明は外国
語の発声発話練習などにも転用することができる。
【0076】また、図2、図5、図8及び図13の機能
ブロック図は、一例であって他の機能ブロック分けを行
うこともできる。また、機能ブロックに対応させてプロ
グラムモジュールを設けなくとも良い。さらに、説明の
都合上同様の機能を有する機能ブロックについても複数
示しているが、一つのモジュールにして共用してもよ
い。また、図6の音声視覚エディタの画面(ウインド
ウ)や、図9の訓練プレイヤー(ウインドウ)や図14
の分析結果表示画面(ウインドウ)の構成は一例であっ
て、他の順番や配列にて表示するような構成であっても
よい。図10についても同様である。また、図9におい
て表示される動画像は、基準音声を発声している人物の
動画像であるとしていたが、例えば発声内容に関連する
又は発声をイメージするアニメーションや動画像等であ
ってもよい。
【0077】
【発明の効果】以上述べたように本発明によれば、発声
発話訓練のための教材データの作成を簡単且つ柔軟に行
うことができるようになる。
【0078】また、適切な発声発話訓練のために必要な
情報を訓練者に提供可能とすることもできる。
【0079】さらに、訓練者の能力に応じた発声発話訓
練を可能とすることもできる。
【0080】さらに、訓練者による発声発話訓練の結果
をより客観的に提示可能とすることもできる。
【図面の簡単な説明】
【図1】本発明の処理フローの概要を示す図である。
【図2】本発明の一実施の形態に係る可視化パラメータ
算出処理の機能ブロック図である。
【図3】本発明の一実施の形態に係る可視化パラメータ
算出処理の処理フローを示す図である。
【図4】(a)音声波形、(b)音声シンボル、(c)
音声可視化記号の一例を示す図である。
【図5】本発明の一実施の形態に係る音声可視化記号修
正処理の機能ブロック図である。
【図6】音声可視化記号修正処理において表示されるウ
インドウの一例である。
【図7】本発明の一実施の形態に係る音声可視化記号修
正処理の処理フローを示す図である。
【図8】本発明の一実施の形態に係る再生処理の機能ブ
ロック図である。
【図9】再生処理において表示されるウインドウの一例
を示す図である。
【図10】再生処理時において再生速度変更を指示する
ためのウインドウの一例を示す図である。
【図11】音声可視化記号の色の変更を模式的に示す図
である。
【図12】本発明の一実施の形態に係る再生処理の処理
フローを示す図である。
【図13】本発明の一実施の形態に係る分析処理の機能
ブロック図である。
【図14】分析処理において表示されるウインドウの一
例を示す図である。
【図15】本発明の一実施の形態に係る分析処理の処理
フローを示す図である。
【図16】比較分析部の処理フローを示す図である。
【図17】音声シンボルの対応関係の一例を示す図であ
る。
【符号の説明】
101 可視化パラメータ算出部 110 訓練素材
データ 111 音声データ 112 動画データ 102 可視化パラメータ情報 120 記号修正処
理部 121 音声再生部 123 音声可視化記号描画部 124 可視化パラメータ編集部 104 指示入力 103 編集済み可視化パラメータ情報 130 再生速度変換処理部 131 フレーム数変
換部 132 話速変換部 133 縮張情報 134 パラメータ縮張部 104 再生速度設定入
力 140 再生・表示処理部 141 動画描画部 142 音声再生部 143 同期信号生成部 144 音声可視化記号描画部 145 訓練者音声
録音部 148 指示入力 105 訓練者収録音声データ 150 分析素材データ 161 評価診断処理部 161 可視化パラメータ算出部 162 訓練者の可視化パラメータ情報 106 基準音声の可視化パラメータ情報 170 結果表示処理部 171 訓練者音声情報描
画部 172 基準音声情報描画部 173 分析結果表示
───────────────────────────────────────────────────── フロントページの続き (72)発明者 服部 一郎 神奈川県横浜市中区尾上町2丁目27番 株 式会社アニモ内 Fターム(参考) 2C028 AA04 AA06 AA12 BA03 BB04 BC05 BD03 5C052 AB04 DD03 DD04 DD06 EE03 5D045 AB13 (54)【発明の名称】 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のための プログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュー タ・システム

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】再生速度を動的に変更可能とする手段を含
    む、発声者の動画像及び音声の同期再生手段が組み込ま
    れた発声発話訓練装置。
  2. 【請求項2】入力音声データを取得し、記憶装置に格納
    するステップと、 前記入力音声データから、少なくとも当該音声の発声
    長、音程及び促音に対応する、発声練習のための音声可
    視化パラメータを抽出し、記憶装置に格納する音声可視
    化パラメータ抽出ステップと、 前記音声可視化パラメータに従って、発声のタイミン
    グ、発声長、音程及び促音についての情報を図形化し、
    表示装置に表示する表示ステップと、 をコンピュータに実行させるためのプログラム。
  3. 【請求項3】前記表示装置に表示された前記発声のタイ
    ミング、発声長、音程及び促音についての情報を表す図
    形を、修正指示に応じて修正して表示するステップと、 修正された図形の位置、長さ及び高さに応じて前記音声
    可視化パラメータを変更し、記憶装置に格納するステッ
    プと、 をさらにコンピュータに実行させるための請求項2記載
    のプログラム。
  4. 【請求項4】前記音声パラメータ抽出ステップが、 前記入力音声データの、所定レベル以上の音圧強度を有
    する部分である音声シンボルを切り出すステップと、 切り出された各前記音声シンボルについて時間的な位
    置、長さ及びピッチについての情報を抽出するステップ
    と、 前記入力音声データ中の促音部の位置を検出するステッ
    プと、 を含むことを特徴とする請求項2又は3記載のプログラ
    ム。
  5. 【請求項5】前記表示ステップが、 前記音声可視化パラメータのうち発声長に関するパラメ
    ータにより図形の長さを決定するステップと、 前記音声可視化パラメータのうち音程に関するパラメー
    タにより図形の高さを決定するステップと、 前記音声可視化パラメータのうち促音に関するパラメー
    タにより促音の図形の位置を決定するステップと、 を含む請求項2乃至4のいずれか1つ記載のプログラ
    ム。
  6. 【請求項6】前記入力音声データの波形を表示するステ
    ップをさらにコンピュータに実行させるための請求項2
    乃至5のいずれか1つ記載のプログラム。
  7. 【請求項7】基準音声を出力するための音声再生出力処
    理と、 前記基準音声を発声している人物の動画像を表示装置に
    表示するための動画像再生処理と、 前記基準音声に対応し且つ発声のタイミング、発声長、
    音程及び促音を表す図形を表示し、当該図形の少なくと
    も発声部分の色を変更することにより表示する図形表示
    処理と、 をコンピュータに実行させるためのプログラム。
  8. 【請求項8】前記音声再生出力処理と前記動画像再生処
    理と前記図形表示処理とを同期させるための同期処理を
    さらにコンピュータに実行させるための請求項7記載の
    プログラム。
  9. 【請求項9】前記図形表示処理が、 前記基準音声の少なくとも発声長、音程及び促音に対応
    する音声可視化パラメータに従って、発声のタイミン
    グ、発声長、音程及び促音についての情報を図形化する
    処理を含む請求項7又は8記載のプログラム。
  10. 【請求項10】前記基準音声の再生速度変更指示におい
    て指定された再生速度に従って、前記基準音声及び前記
    基準音声を発声している人物の動画像の再生速度と、前
    記基準音声に対応し且つ発声のタイミング、発声長、音
    程及び促音を表す図形の形状と、当該図形の色の変更速
    度とを変更するための速度変更処理をさらにコンピュー
    タに実行させるための請求項7乃至9のいずれか1つ記
    載のプログラム。
  11. 【請求項11】前記速度変更処理が、 前記基準音声の少なくとも発声長、音程及び促音に対応
    する音声可視化パラメータを前記指定された再生速度に
    従って変更し、記憶装置に格納する処理を含むことを特
    徴とする請求項10記載のプログラム。
  12. 【請求項12】前記速度変更処理が、 前記基準音声のデータを前記指定された再生速度に従っ
    て変更し、当該基準音声のデータの縮張内容に関する縮
    張情報を生成する処理と、 生成された前記縮張情報を用いて、前記基準音声の少な
    くとも発声長、音程及び促音に対応する音声可視化パラ
    メータを変更する処理と、 を含む請求項10記載のプログラム。
  13. 【請求項13】前記速度変更処理を動的に実施すること
    を特徴とする請求項10乃至12のいずれか1つ記載の
    プログラム。
  14. 【請求項14】前記同期処理において、 前記基準音声の再生速度変更指示において指定された再
    生速度に対応する縮張情報を用いて、前記発声のタイミ
    ング、発声長、音程及び促音を表す図形の色の変更と、
    前記動画像の再生とを、前記指定された再生速度に応じ
    て変更された前記基準音声の再生に同期させるための情
    報を生成することを特徴とする請求項8記載のプログラ
    ム。
  15. 【請求項15】訓練者が発声した音声データを録音する
    処理をさらにコンピュータに実行させるための請求項7
    乃至14のいずれか1つ記載のプログラム。
  16. 【請求項16】前記基準音声の音声データから抽出され
    る所定のパラメータと前記訓練者の音声データから抽出
    される所定のパラメータとを用いて、前記訓練者が発声
    した音声と前記基準音声との類似度を分析する分析処
    理、 をさらにコンピュータに実行させるための請求項15記
    載のプログラム。
  17. 【請求項17】前記訓練者が発声した音声のデータと前
    記基準音声のデータとを所定の事項について比較可能な
    態様にて表示すると共に、前記訓練者が発声した音声と
    前記基準音声との類似度に関する情報を表示する処理を
    さらにコンピュータに実行させるための請求項16記載
    のプログラム。
  18. 【請求項18】前記分析処理が、 前記訓練者が発声した音声データの、所定レベル以上の
    音圧強度を有する部分である音声シンボルと前記基準音
    声の音声データの音声シンボルとの距離に関する情報を
    所定の方法で算出し、記憶装置に格納する処理と、 算出された前記距離に関する情報を用いて、前記訓練者
    が発声した音声データの音声シンボルと前記基準音声の
    音声データの音声シンボルとの対応関係を検出する処理
    と、 検出された前記対応関係を有する前記訓練者が発声した
    音声データの音声シンボルと前記基準音声の音声データ
    の音声シンボルとの距離に関する情報を用いて、前記訓
    練者が発声した音声と前記基準音声との類似度に関する
    情報を算出し、記憶装置に格納する処理と、 を含む請求項17記載のプログラム。
  19. 【請求項19】訓練者が発声した音声のデータと基準音
    声のデータとを所定の事項について比較可能な態様にて
    表示する処理と、 前記訓練者が発声した音声のデータの、所定レベル以上
    の音圧強度を有する部分である音声シンボルと前記基準
    音声の音声データの音声シンボルとの距離に関する情報
    を所定の方法で算出し、記憶装置に格納する処理と、 算出された前記距離に関する情報を用いて、前記訓練者
    が発声した音声データの音声シンボルと前記基準音声の
    音声データの音声シンボルとの対応関係を検出する処理
    と、 検出された前記対応関係を有する前記訓練者が発声した
    音声データの音声シンボルと前記基準音声の音声データ
    の音声シンボルとの距離に関する情報を用いて、前記訓
    練者が発声した音声と前記基準音声との類似度に関する
    情報を算出し、表示装置に表示する処理と、 をコンピュータに実行させるためのプログラム。
  20. 【請求項20】前記訓練者が発声した音声のデータにつ
    いて検出された前記対応関係の個数に関する情報を算出
    し、表示装置に表示する処理をさらにコンピュータに実
    行させるための請求項19記載のプログラム。
  21. 【請求項21】前記訓練者が発声した音声と前記基準音
    声との類似度に関する情報が、 少なくともスペクトル構造に関する類似度と音圧に関す
    る類似度とのいずれかを含むことを特徴とする請求項1
    9又は20記載のプログラム。
  22. 【請求項22】入力音声データを取得し、記憶装置に格
    納する手段と、 前記入力音声データから、少なくとも当該音声の発声
    長、音程及び促音に対応する、発声練習のための音声可
    視化パラメータを抽出し、記憶装置に格納する音声可視
    化パラメータ抽出手段と、 前記音声可視化パラメータに従って、発声のタイミン
    グ、発声長、音程及び促音についての情報を図形化し、
    表示装置に表示する手段と、 を有するコンピュータ・システム。
  23. 【請求項23】基準音声を出力するための音声再生出力
    手段と、 前記基準音声を発声している人物の動画像を表示装置に
    表示するための動画像再生手段と、 前記基準音声に対応し且つ発声のタイミング、発声長、
    音程及び促音を表す図形を表示し、当該図形の少なくと
    も発声部分の色を変更することにより表示する図形表示
    手段と、 を有するコンピュータ・システム。
  24. 【請求項24】訓練者が発声した音声のデータと基準音
    声のデータとを所定の事項について比較可能な態様にて
    表示する手段と、 前記訓練者が発声した音声のデータの、所定レベル以上
    の音圧強度を有する部分である音声シンボルと前記基準
    音声の音声データの音声シンボルとの距離に関する情報
    を所定の方法で算出し、記憶装置に格納する手段と、 算出された前記距離に関する情報を用いて、前記訓練者
    が発声した音声データの音声シンボルと前記基準音声の
    音声データの音声シンボルとの対応関係を検出する手段
    と、 検出された前記対応関係を有する前記訓練者が発声した
    音声データの音声シンボルと前記基準音声の音声データ
    の音声シンボルとの距離に関する情報を用いて、前記訓
    練者が発声した音声と前記基準音声との類似度に関する
    情報を算出し、表示装置に表示する手段と、 を有するコンピュータ・システム。
JP2001380679A 2001-12-13 2001-12-13 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム Withdrawn JP2003186379A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001380679A JP2003186379A (ja) 2001-12-13 2001-12-13 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001380679A JP2003186379A (ja) 2001-12-13 2001-12-13 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム

Publications (1)

Publication Number Publication Date
JP2003186379A true JP2003186379A (ja) 2003-07-04

Family

ID=27591628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001380679A Withdrawn JP2003186379A (ja) 2001-12-13 2001-12-13 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム

Country Status (1)

Country Link
JP (1) JP2003186379A (ja)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115391A (ja) * 2003-10-08 2005-04-28 Agfa Inc テキストのディスプレイとオーディオの再生とを同期させるためのシステム及び方法
JP2005128177A (ja) * 2003-10-22 2005-05-19 Ace:Kk 発音学習支援方法、学習者端末及び処理プログラム並びに該プログラムを記録した記録媒体
JP2006162849A (ja) * 2004-12-06 2006-06-22 Yamaha Corp 音声処理装置
JP2006243230A (ja) * 2005-03-02 2006-09-14 Advanced Telecommunication Research Institute International 歌声評定装置およびプログラム
JP2007140079A (ja) * 2005-11-17 2007-06-07 Yamaha Corp 再生装置
JP2007139868A (ja) * 2005-11-15 2007-06-07 Yamaha Corp 語学学習装置
WO2007129392A1 (ja) * 2006-04-25 2007-11-15 Shimada Managedevelopment Co., Ltd. 主機と副機を有する失語症練習支援装置
JP2010262090A (ja) * 2009-05-01 2010-11-18 Nintendo Co Ltd 学習支援プログラムおよび学習支援装置
WO2013168363A1 (ja) * 2012-05-09 2013-11-14 テルモ株式会社 言語療法ロボット
WO2013168364A1 (ja) * 2012-05-09 2013-11-14 テルモ株式会社 言語療法ロボット
WO2014087571A1 (ja) * 2012-12-07 2014-06-12 テルモ株式会社 情報処理装置および情報処理方法
JP2014240902A (ja) * 2013-06-11 2014-12-25 株式会社ジャストシステム 学習支援装置
WO2015177908A1 (ja) * 2014-05-22 2015-11-26 株式会社日立製作所 訓練システム
JP2016156943A (ja) * 2015-02-24 2016-09-01 ブラザー工業株式会社 表示制御装置、表示制御方法、及びプログラム
JP2016225755A (ja) * 2015-05-28 2016-12-28 富士通株式会社 通話装置およびプログラム
JP2017015823A (ja) * 2015-06-29 2017-01-19 ブラザー工業株式会社 発話練習装置、表示制御方法、及びプログラム
JP2017037110A (ja) * 2015-08-07 2017-02-16 デジタルセンセーション株式会社 情報処理装置
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
WO2018192295A1 (zh) * 2017-04-19 2018-10-25 山东英才学院 一种儿童音乐学习教具
CN112687280A (zh) * 2020-12-25 2021-04-20 浙江弄潮儿智慧科技有限公司 一种具有频谱-时间空间界面的生物多样性监测系统
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
JP2021113904A (ja) * 2020-01-20 2021-08-05 泰宏 中野 音声学習システム、および音声学習方法
KR20220102974A (ko) * 2021-01-14 2022-07-21 가톨릭대학교 산학협력단 음성 장애 환자를 위한 음성 자가 훈련 방법 및 사용자 단말 장치
US11959296B2 (en) 2019-05-30 2024-04-16 Gravetime Inc. Graveside memorial telepresence method, apparatus and system

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115391A (ja) * 2003-10-08 2005-04-28 Agfa Inc テキストのディスプレイとオーディオの再生とを同期させるためのシステム及び方法
JP4725948B2 (ja) * 2003-10-08 2011-07-13 アグフア・ヘルスケア・インコーポレーテツド テキストのディスプレイとオーディオの再生とを同期させるためのシステム及び方法
JP2005128177A (ja) * 2003-10-22 2005-05-19 Ace:Kk 発音学習支援方法、学習者端末及び処理プログラム並びに該プログラムを記録した記録媒体
JP2006162849A (ja) * 2004-12-06 2006-06-22 Yamaha Corp 音声処理装置
JP4517838B2 (ja) * 2004-12-06 2010-08-04 ヤマハ株式会社 音声処理装置
JP2006243230A (ja) * 2005-03-02 2006-09-14 Advanced Telecommunication Research Institute International 歌声評定装置およびプログラム
JP4524634B2 (ja) * 2005-03-02 2010-08-18 株式会社国際電気通信基礎技術研究所 歌声評定装置およびプログラム
JP2007139868A (ja) * 2005-11-15 2007-06-07 Yamaha Corp 語学学習装置
JP2007140079A (ja) * 2005-11-17 2007-06-07 Yamaha Corp 再生装置
JP4654889B2 (ja) * 2005-11-17 2011-03-23 ヤマハ株式会社 再生装置
WO2007129392A1 (ja) * 2006-04-25 2007-11-15 Shimada Managedevelopment Co., Ltd. 主機と副機を有する失語症練習支援装置
JP2010262090A (ja) * 2009-05-01 2010-11-18 Nintendo Co Ltd 学習支援プログラムおよび学習支援装置
US10565997B1 (en) 2011-03-01 2020-02-18 Alice J. Stiebel Methods and systems for teaching a hebrew bible trope lesson
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
US11380334B1 (en) 2011-03-01 2022-07-05 Intelligible English LLC Methods and systems for interactive online language learning in a pandemic-aware world
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
JPWO2013168364A1 (ja) * 2012-05-09 2016-01-07 テルモ株式会社 言語療法ロボット
WO2013168364A1 (ja) * 2012-05-09 2013-11-14 テルモ株式会社 言語療法ロボット
WO2013168363A1 (ja) * 2012-05-09 2013-11-14 テルモ株式会社 言語療法ロボット
WO2014087571A1 (ja) * 2012-12-07 2014-06-12 テルモ株式会社 情報処理装置および情報処理方法
JPWO2014087571A1 (ja) * 2012-12-07 2017-01-05 テルモ株式会社 情報処理装置および情報処理方法
US9928830B2 (en) 2012-12-07 2018-03-27 Terumo Kabushiki Kaisha Information processing apparatus and information processing method
JP2014240902A (ja) * 2013-06-11 2014-12-25 株式会社ジャストシステム 学習支援装置
WO2015177908A1 (ja) * 2014-05-22 2015-11-26 株式会社日立製作所 訓練システム
JPWO2015177908A1 (ja) * 2014-05-22 2017-04-20 株式会社日立製作所 訓練システム
JP2016156943A (ja) * 2015-02-24 2016-09-01 ブラザー工業株式会社 表示制御装置、表示制御方法、及びプログラム
JP2016225755A (ja) * 2015-05-28 2016-12-28 富士通株式会社 通話装置およびプログラム
JP2017015823A (ja) * 2015-06-29 2017-01-19 ブラザー工業株式会社 発話練習装置、表示制御方法、及びプログラム
JP2017037110A (ja) * 2015-08-07 2017-02-16 デジタルセンセーション株式会社 情報処理装置
WO2018192295A1 (zh) * 2017-04-19 2018-10-25 山东英才学院 一种儿童音乐学习教具
US11959296B2 (en) 2019-05-30 2024-04-16 Gravetime Inc. Graveside memorial telepresence method, apparatus and system
JP2021113904A (ja) * 2020-01-20 2021-08-05 泰宏 中野 音声学習システム、および音声学習方法
CN112687280A (zh) * 2020-12-25 2021-04-20 浙江弄潮儿智慧科技有限公司 一种具有频谱-时间空间界面的生物多样性监测系统
CN112687280B (zh) * 2020-12-25 2023-09-12 浙江弄潮儿智慧科技有限公司 一种具有频谱-时间空间界面的生物多样性监测系统
KR20220102974A (ko) * 2021-01-14 2022-07-21 가톨릭대학교 산학협력단 음성 장애 환자를 위한 음성 자가 훈련 방법 및 사용자 단말 장치
KR102484006B1 (ko) * 2021-01-14 2022-12-30 가톨릭대학교 산학협력단 음성 장애 환자를 위한 음성 자가 훈련 방법 및 사용자 단말 장치

Similar Documents

Publication Publication Date Title
JP2003186379A (ja) 音声可視化処理のためのプログラム、音声可視化図形表示と音声及び動画像の再生処理のためのプログラム、及び訓練結果表示のためのプログラム、並びに発声発話訓練装置及びコンピュータ・システム
US5940797A (en) Speech synthesis method utilizing auxiliary information, medium recorded thereon the method and apparatus utilizing the method
US5278943A (en) Speech animation and inflection system
US6358054B1 (en) Method and apparatus for teaching prosodic features of speech
US20090305203A1 (en) Pronunciation diagnosis device, pronunciation diagnosis method, recording medium, and pronunciation diagnosis program
JPH065451B2 (ja) 発音訓練装置
KR20150076126A (ko) 동적 발음 지원 시각화 수단을 포함하는 활용 발음 학습 지원 시스템 및 그 시스템의 발음 학습 지원 방법
US20240087591A1 (en) Methods and systems for computer-generated visualization of speech
JP2006337667A (ja) 発音評価方法、音素列モデル学習方法、これらの方法を用いた装置、プログラム、および記録媒体。
JP3701850B2 (ja) 音声言語の韻律表示装置および記録媒体
JP2003162291A (ja) 語学学習装置
KR100710600B1 (ko) 음성합성기를 이용한 영상, 텍스트, 입술 모양의 자동동기 생성/재생 방법 및 그 장치
JP2844817B2 (ja) 発声練習用音声合成方式
JP4744338B2 (ja) 合成音声生成装置
JP3059022B2 (ja) 動画像表示装置
JPH0756494A (ja) 発音訓練装置
JP2002525663A (ja) ディジタル音声処理装置及び方法
EP0982684A1 (en) Moving picture generating device and image control network learning device
JP2006139162A (ja) 語学学習装置
JP2006284645A (ja) 音声再生装置およびその再生プログラムならびにその再生方法
JP2001125599A (ja) 音声データ同期装置及び音声データ作成装置
JP3785892B2 (ja) 音声合成装置及び記録媒体
KR20150075502A (ko) 발음 학습 지원 시스템 및 그 시스템의 발음 학습 지원 방법
JPH01154189A (ja) 発音訓練装置
JP2011232775A (ja) 発音学習装置及び発音学習プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301