JPH0685105B2 - 発声訓練方式 - Google Patents

発声訓練方式

Info

Publication number
JPH0685105B2
JPH0685105B2 JP59242351A JP24235184A JPH0685105B2 JP H0685105 B2 JPH0685105 B2 JP H0685105B2 JP 59242351 A JP59242351 A JP 59242351A JP 24235184 A JP24235184 A JP 24235184A JP H0685105 B2 JPH0685105 B2 JP H0685105B2
Authority
JP
Japan
Prior art keywords
circuit
pattern
student
time series
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59242351A
Other languages
English (en)
Other versions
JPS61121077A (ja
Inventor
敦仁 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59242351A priority Critical patent/JPH0685105B2/ja
Publication of JPS61121077A publication Critical patent/JPS61121077A/ja
Publication of JPH0685105B2 publication Critical patent/JPH0685105B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、教師の発声パタンに対する生徒の発声パタン
の距離を演算することにより該距離を基準として発声の
イントネーション評価を行うようにした発声訓練方式に
関する。
〔従来の技術と発明が解決しようとする問題点〕
従来の発声訓練方式としては第1にテキストとオーディ
オテープを用いた形式のものが多い。
しかし、この第1方式では発声の良否や模範となる教師
の発音パタンとの相違を、生徒の耳で判断させる聴覚機
能に依存させている。
このため、生徒が正確に判断できないことがあり、学習
効果が上がらないという問題点があった。
また、第2の方式としてパーソナルコンピュータと音声
入力機器を組み合わせることによりアクセント、イント
ネーションの評価特徴量として音声パワー、基本周波数
パタンなどを視覚情報に変換し生徒に示すものがある。
しかし、この方式では生徒が自分自身でこの視覚情報を
使用して自己の発声の良否を客観的に判断することは困
難であるという問題点がある。
〔問題点を解決するための手段〕
本発明によれば、入力音声を音声分析回路により基本周
波数時系列パタンに変換した後視覚情報出力回路により
視覚情報に変換し表示入力部に表示するようにした発声
訓練方式において、上記音声分析回路の出力側に上記基
本周波数時系列パタンを対数に変換する対数変換回路と
該対数変換後パタンの無声音部を線形補間する無声音部
補間回路を順次接続すると共に該無声音部補間回路の出
力を上記視覚情報出力回路に入力しかつ上記無声音部補
間回路の出力側に上記対数変換補間後基本周波数時系列
パタンの平均値を算定する平均値演算回路と該平均値に
対する変位量を求めて対数変換補間後基本周波数変位量
時系列パタンに変換する補正変換回路とを順次持続し、
更に該補正変換回路の出力側に上記表示入力部からの信
号により切り替わる切替回路と教師の上記変位量時系列
パタンを格納する辞書メモリと生徒の上記変位量時系列
パタンを格納する一時メモリと上記教師及び生徒パタン
間の差である距離を算定するマッチング回路と該距離に
基いて教師の上記入力音声に対する生徒の上記入力音声
を評価して上記表示入力部に送出する評価回路とを設け
ることにより、上記表示入力部からの指示により上記切
替回路を切り替えて上記両メモリに上記教師パタンと生
徒パタンを格納して上記マッチング回路で上記距離を算
定し評価回路から送出された評価を上記表示入力部に表
示することを特徴とする発声訓練方式が提供される。
〔作 用〕
本発明方式は、入力音声の特徴パラメータである基本周
波数時系列パタンを一話者の個性に基く声の高低の変動
を吸収するために対数変換すると共に無声音区間を補間
し、該補間後の対数変換基本周波数時系列パタンを複数
話者間の音の高低変動吸収のために平均値からの変位量
パタンに変換し、該変位量パタンを教師パタンと生徒パ
タンとで切り替えて別個のメモリに格納して両者の上記
変位量パタン差を距離として比較できるので、教師パタ
ンに対する生徒パタンの評価が客観的に可能となり発声
訓練を行う生徒の学習意欲が向上する。
〔実施例〕
以下、本発明を実施例により添付図面を参照して説明す
る。
第1図は、本発明に係る発声訓練方式を実施するための
装置構成図である。
上記装置は、マイクロホン1から入力された生徒の音声
と教師の音声とが切替回路10により前者は一時メモリ11
へ、後者は辞書メモリ14へそれぞれ格納され、表示入力
部7からの指示に基いてマッチング回路12で上記両音声
の比較がされ、その結果は評価回路15で評価されて表示
入力部7で表示されるようになっている。
マイクロホン1は発声された生徒または教師の音声を入
力する入力媒体、A/D変換器2は上記入力音声をアナロ
グからデジタルへ変換する装置、音声分析回路3はデジ
タル入力音声から基本周波数パタンを抽出する回路、対
数変換回路4は上記基本周波数パタンを対数尺度に変換
する回路、無声音部補間回路5は上記基本周波数パタン
の無声音区間を線形補間する回路、視覚情報出力回路6
は上記補間後の音声を視覚情報に変換する回路、表示入
力部7は上記音声を表示すると共に切替回路10とメモリ
指示回路13への制御信号を入力する装置、平均値演算回
路8は基本周波数の平均値を算出する回路、補正変換回
路9は平均周波数を上記平均基本周波数に対する変位量
の時系列パタンに変換する回路、切替回路10は表示入力
部7からの指令により教師音声の場合は辞書メモリ14側
へ生徒音声の場合は一時メモリ11側へ、それぞれ切り替
わる回路、一時メモリ11は生徒音声の変位量基本周波数
パタンを教師音声のそれとのマッチングのため一時的に
格納するメモリ、マッチング回路12は上記一時メモリ11
の生徒変位量パタンと辞書メモリ14の教師変位量パタン
とを読み込んで時間正規後に両パタンの距離計算を行う
回路、メモリ指示回路13は表示入力部7の指示により切
替回路10を介して辞書メモリ14へ教師パタンを格納し又
は該格納された教師パタンをマッチング回路12へ入力さ
せる回路、辞書メモリ14は教師パタンを登録しておきそ
れを生徒パタンに対する模範パタンとして使用するため
のメモリ、評価回路15は上記マッチング回路12で演算さ
れた教師パタンと生徒パタンの距離を評価し該評価結果
を表示入力部7に送出する回路である。
上記構成を有する第1図の動作を、第2図乃至第4図に
基いて以下説明する。
マイクロホン1から入力される音声は、予め定められた
テキストに従って発声されるものとし、該入力された音
声を次段のA/D変換器2でデジタル変換する。
次に上記デジタル変換した入力音声を音声分析回路3に
よって基本周波数の時系列パタンを抽出する。
第2図は成人男性話者が「enjoy」と発声した音声から
抽出された基本周波数の時系列パタンの例を示すグラフ
である。
即ち、第2図(B)に示すように、横軸に時間t、縦軸
に基本周波数fをそれぞれとってグラフを描けば、
「e」と「n」で2つの山が見られ、また「n」と
「j」の間で途切れて「o」で最大となり「y」で最低
となる時系列パタンが得られる。 この第2図(B)を
上記「enjoy」に対応して音声波形で表わすと第2図
(A)のようになる。次に、音声分析回路3から出力さ
れた上記基本周波数時系列パタンを次段の対数変換回路
4により対数尺度に変換する。
いま、回路3で求めた基本周波数パタンをFとすれば個
々の音声要素の周波数をf1f2……fnとして F=f1,f2,……fn ……(1) 従って(1)式を対数変換すれば、 log F=log f1,log f2…log fn ……(2) となる。
このように対数変換するのは、対数尺度上で(2)式の
ように基本周波数パタンを表現した場合、そのパタンの
形状が話者の特有の声の高さによらずに一定のパタンに
落ち着き、これにより発声話者の個性に基く声の高低の
変動を吸収し、評価が一層客観的になるからである。
この対数変換された基本周波数時系列パタンlog Fは、
無声音部補間回路5で無声音区間を線形補間する。即
ち、第3図に示す対数変換基本周波数時系列パタンのグ
ラフを見るとわかるように、「n」と「j」の間の部分
が欠けている。これは基本周波数は音声分析回路3にお
いては音帯振動を伴う有声音の優勢な部分のみで観測さ
れ無声音部及び無音部,及び有声音ではあるがその特徴
が明確でない部分、例えば上記の「n」と「j」の間の
ような場合においては抽出されにくいからである。
従って無区間L(上記基本周波数が観測されにくい部分
を総称してここでは無声音区間とする)を回路5によっ
て、破線で示すように、線形補間する。
この線形補間された対数変換基本周波数時系列パタン
は、一方において平均値演算回路8に入力されて平均基
本周波数fMが計算される。
即ち このfMを使用して、補正変換回路9により該平均値fMに
対する変位量時系列パタンを求める。
いま、変位量パタンを△Fとすれば △F=log f1−fM,,log f2−fM, ……log fm−fm ……(4) この(4)式をグラフを用いて図示したのが、第4図で
あり、矢印で示した個所が(4)式の右辺各項を表わし
ている。
この変換を行うのは、話者相互間の声の高低の変動を吸
収し、対数変換基本周波数時系列パタンの形状そのもの
を強調できるからである(第4図)。
また、他方においては、上記無声音部補間回路5から出
力された補間後のパタンは(第3図)視覚情報出力回路
6へ入力されて視覚情報に変換され表示入力部7のディ
スプレイに表示される(OUT)。
ところで、この表示入力部7は切替回路10の切替制御を
も承り、上記マイクロホン1へ入力されて以後上記補正
変換回路9で変換された音声が教師のものであれば上記
切替回路10のスイッチが辞書メモリ14側に切り替わる。
同時に、入力部7からの信号によりメモリ指示回路13を
介して、補正変換回路9を経た変位量時系列パタンは辞
書メモリ14に格納される。
上記マイクロホン1から生徒音声の場合は、入力部7か
らの信号により切替回路10スイッチが一時メモリ11側に
切替わり、該メモリ11に生徒の変位量時系列パタン(第
4図)が格納される。そしてメモリ指示回路13を介し
て、辞書メモリ14の教師パタンと一時メモリ11の生徒パ
タンがマッチング回路12に読み込まれる。読み込まれた
両パタンは時間正規後に距離計算が行わされる。
この場合の距離は、次のようにして演算される。(4)
式の右辺各項を△f1,△f2……△fnとおいて教師パタン
の場合は右肩に添字1を、生徒パタンの場合は右肩に添
字2を、それぞれつけて表わすと次のようになる。
△F1=△f1 1,△f2 1…△fn1 ……(5) △F2=△f1 2,△f2 2…△fn2 ……(6) このうち(5),(6)式について時間正規化を行う
と、 △G1=△g1 1,△g2 1…△gN1 ……(5)′ △G2=△g1 2,△g2 2…△gN2 ……(6)′ となる。
(5)′,(6)′式においてNは正規化分割数、△g
は該Nに応じて分割された各区間内の△fの平均値であ
る。
この(5)′,(6)′式で表現された教師パタンと生
徒パタンの差 を両者の距離と定義する。
上記距離dを評価回路15へ入力して発声イントネーショ
ンの評価量として使用し、予め定められた評価基準に従
ったものを表示入力部7へ送出する。
この基準をディスプレイ(OUT)に表示すれば、生徒に
対して装置側から発声の良否を知らせることができる。
〔発明の効果〕
本発明によれば、入力音声の特徴パタメータである基本
周波数時系列パタンを一話者の個性に基く声の高低の変
動を吸収するために対数変換すると共に無声音区間を補
間し、該補間後の対数変換基本周波数時系列パタンを複
数話者間の音の高低変動吸収のために平均値からの変位
量パタンに変換し、該変位量パタンを教師パタンと生徒
パタンとで切り替えて個別のメモリに格納して両者の上
記変位量パタン差を距離として比較できるので、教師パ
タンに対する生徒パタンの評価が客観的に可能となり発
声訓練を行う生徒の学習意欲が向上する。
【図面の簡単な説明】
第1図は本発明方式を実施するための装置の構成図、第
2図(A),(B)から第4図までは第1図に示す装置
の動作説明図である。 1……マイクロホン、2……A/D変換器、 3……音声分析回路、4……対数変換回路、 5……無声音部補間回路、 6……視覚情報出力回路、 7……表示入力部、8……平均値演算回路、 9……補正変換回路、10……切替回路、 11……一時メモリ、12……マッチング回路、 13……メモリ指示回路、 14……辞書メモリ、15……評価回路。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力音声を音声分析回路により基本周波数
    時系列パタンに変換した後視覚情報出力回路により視覚
    情報に変換し表示入力部に表示するようにした発声訓練
    方式において、上記音声分析回路の出力側に上記基本周
    波数時系列パタンを対数に変換する対数変換回路と該対
    数変換後パタンの無音声部を線形補間する無声音部補間
    回路を順次接続すると共に該無声音部補間回路の出力を
    上記視覚情報出力回路に入力しかつ上記無声音部補間回
    路の出力側に上記対数変換補間後基本周波数時系列パタ
    ンの平均値を算定する平均値演算回路と該平均値に対す
    る変位量を求めて対数変換補間後基本周波数変位量時系
    列パタンに変換する補正変換回路とを順次接続し、更に
    該補正変換回路の出力側に上記表示入力部からの信号に
    より切り替わる切替回路と教師の上記変位量時系列パタ
    ンを格納する辞書メモリと生徒の上記変位量時系列パタ
    ンを格納する一時メモリと上記教師及び生徒パタン間の
    差である距離を算定するマッチング回路と該距離に基い
    て教師の上記入力音声に対する生徒の上記入力音声を評
    価して上記表示入力部に送出する評価回路とを設けるこ
    とにより、上記表示入力部からの指示により上記切替回
    路を切り替えて上記両メモリに上記教師パタンと生徒パ
    タンを格納して上記マッチング回路で上記距離を算定し
    評価回路から送出された評価を上記表示入力部に表示す
    ることを特徴とする発声訓練方式。
JP59242351A 1984-11-19 1984-11-19 発声訓練方式 Expired - Lifetime JPH0685105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59242351A JPH0685105B2 (ja) 1984-11-19 1984-11-19 発声訓練方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59242351A JPH0685105B2 (ja) 1984-11-19 1984-11-19 発声訓練方式

Publications (2)

Publication Number Publication Date
JPS61121077A JPS61121077A (ja) 1986-06-09
JPH0685105B2 true JPH0685105B2 (ja) 1994-10-26

Family

ID=17087899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59242351A Expired - Lifetime JPH0685105B2 (ja) 1984-11-19 1984-11-19 発声訓練方式

Country Status (1)

Country Link
JP (1) JPH0685105B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0627971B2 (ja) * 1987-02-06 1994-04-13 ティアツク株式会社 イントネーション測定装置および語学学習装置
JPH0812535B2 (ja) * 1988-03-14 1996-02-07 株式会社河合楽器製作所 発音訓練装置
JPH01173768U (ja) * 1988-05-28 1989-12-11
JP3052682U (ja) 1998-03-27 1998-09-29 船井電機株式会社 映像装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52110132A (en) * 1976-03-11 1977-09-16 Kokusai Electric Co Ltd Language training device
JPS6032195B2 (ja) * 1980-04-11 1985-07-26 松下電器産業株式会社 語学練習機
JPS5796377A (en) * 1980-12-05 1982-06-15 Matsushita Electric Ind Co Ltd Pronuntiation training apparatus

Also Published As

Publication number Publication date
JPS61121077A (ja) 1986-06-09

Similar Documents

Publication Publication Date Title
US6535852B2 (en) Training of text-to-speech systems
JP4867804B2 (ja) 音声認識装置及び会議システム
US8898055B2 (en) Voice quality conversion device and voice quality conversion method for converting voice quality of an input speech using target vocal tract information and received vocal tract information corresponding to the input speech
US6336089B1 (en) Interactive digital phonetic captioning program
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
US20180082607A1 (en) Interactive Video Captioning Program
JPH10105191A (ja) 音声認識装置及びマイクロホン周波数特性変換方法
JP4353202B2 (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
EP0191531B1 (en) A method and an arrangement for the segmentation of speech
JPH05307399A (ja) 音声分析方式
JPH0685105B2 (ja) 発声訓練方式
JPH08248994A (ja) 声質変換音声合成装置
JP2844817B2 (ja) 発声練習用音声合成方式
JP4839970B2 (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JPH0229232B2 (ja)
US20050171777A1 (en) Generation of synthetic speech
JP2536169B2 (ja) 規則型音声合成装置
JP2004341340A (ja) 話者認識装置
JPS616732A (ja) 発声訓練装置
JP4387822B2 (ja) 韻律正規化システム
JPH02153397A (ja) 音声収録装置
KR20080065775A (ko) 구화 교육용 발성 시각화 시스템
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JP2638151B2 (ja) 会話補助装置