JPS60170885A - 単音節音声学習方式 - Google Patents

単音節音声学習方式

Info

Publication number
JPS60170885A
JPS60170885A JP59026413A JP2641384A JPS60170885A JP S60170885 A JPS60170885 A JP S60170885A JP 59026413 A JP59026413 A JP 59026413A JP 2641384 A JP2641384 A JP 2641384A JP S60170885 A JPS60170885 A JP S60170885A
Authority
JP
Japan
Prior art keywords
monosyllabic
speech
input
learning
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59026413A
Other languages
English (en)
Inventor
寺尾 修
田村 鉄夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59026413A priority Critical patent/JPS60170885A/ja
Publication of JPS60170885A publication Critical patent/JPS60170885A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (al 発明の技術分野 本発明は1日本語音声入力装置の単音節音声all K
h装置において、トレーニングモードでの学習を実施す
る場合の単音節音声学習方式に関する。
(bl 技術の背景 近来、音声認識技術はデータ処理技術の発達と、音声認
識アルゴリズムのための複雑高度な論理回路、及び高速
大容量を要する手段等が、半導体年債化技術の進展によ
る小型化・低コストの高集積lrJ路素子(LSI)の
実現により可能となり。
口木語音声によるデータ処理が容易にできる日本語音声
入力の音声認識装置が実用化されてきた。
しかし、この日本語音声入力による音声認識装置であっ
ても、その人による癖、訛、その時の体調等により、単
音節を登録し、実際に使用する場合の音声とではかなり
異なる場合が存在することが多く、認識率に差が生ずる
結果となり、1−レーニングモードでの学習を如何に能
率的に行うかが認識率を左右する要素の1つである。
(C1従来技術と問題点 従来の、この種の音声認識装置での学習方法について説
明する。第1図は従来の音声認識装置の学習モード時に
おける構成ブロック図を示す。
音声認識装置による学習方法は、まず、学習する学習者
が離散的な単音節を発声してその単音節を登録する場合
は、学習者が数回同一単音節の単語を発声するようにし
ているが1本例では説明を簡単にするため、3回発声す
るものとする。マイクロホン1からある単語の離散単音
節を発声し、その1回目の音声を音声分析部2に入力す
る。音声分析部2に入力された1回目の音声は複数の帯
域フィルター)IYに印加して複数のスペクトルを出力
し5 この複数のスペクトルを特徴バラメーク抽出部3
に入力する。特徴パラメータ抽出部3で数ms程度のフ
レーム同期で標本化し、線形ll)間正規化してfli
音節の特徴パラメータ時系列を抽出して特徴パラメータ
バッファ4に出力する。この出力した特徴パラメータ時
系列は一旦特徴パラメータバッファ4に格納される。特
徴パラメータバッファ4に格納された特徴パラメータ時
系列は、切替スイッチ5の実線側を通して、単音節辞書
6の単音節標準パターン6aとして登録される。次に、
2回目と3回目は切替スイッチ5を学習モード側(点線
側)に切替え、2回目と3回目の音声をマイクロホンl
に入力し、上記同様の径路で2回目と3回目の特徴パラ
メータ時系列を切替スイッチ6の学習モード側を介して
順次特徴パラメータバッファ7a、 71+に単音節学
習パターンとして格納する。
続いて5 この特徴パラメータバッファ7aに格納され
た単音節学習パターンと、単音節辞店6に登録された1
、i’4.8′節標準パターン6aとを単音節照合部8
で照合し、照合結果の照合距離を認識判定部9に送る。
認識判定部9では規定の照合距離以内の場合はパターン
平均化部10に平均化する指示を与え。
パターン平均化部10で単音節学習バクーン、と登録さ
れていノこ単音節標準パターン6aとを平均化処理を行
い、パターン平均化部10より平均化された単音節標準
パターンを単音節辞書6に入力し、先に登録されていた
l’B音節標準パターン6aが更新し届き換えられる。
次に、3回目の特徴パラメータノ\ノファ71Jに格坏
jされていた単音節学習パターンも上記同様の手順で照
合が行われ、平均化指示が与えられれば、先に登録され
ていた単音節標準パターン6aと3回目の単音節学習バ
クーンとをパターン平均化部10で更に平均化処理を行
い、単音節標準パターン6aが再度書き換え更新される
。従って。
2回目と3回目の単音節学習パターンの照合距離が共に
規定の照合距離以内の場合は、単音節辞書。
6の単音節標準パターン6aば3個を平均化した単音節
標準パターンとして登録されることとなる。
以上の学習動作を登録する必要な単語数だけ繰り返し行
って、単音節辞2i−6の単音節標準パターンEi+i
 −6nとして順次登録される。
この認識判定部9とパターン平均化部10は、学習者の
その日の体調や緊張度等により声がかすれたり1発声強
弱等があり、毎回発声する単音節発声が常に同一とは限
らないため、最低3回発声さ・已てJJi似の発声音を
常に発声しているかどうかを。
Qj音節相互間の照合距離により判定し認識するもので
、認識された同一単語の複数の単音節の特徴パラメータ
時系列を平均化して単音節標準パターンとして登録し、
認識モード時に認識率が向上するよう耐応された機能で
ある。
また、2回目又は3回目の単音節学習パターンの照合距
離が規定の照合距離以上である場合は。
認識判定部9よりパターン平均化部10へは平均化指示
は出力せず、認識判定部9で発声不良の単音部名を2g
 識し、ディスプレイ11にメソセージ表示する。この
発声不良のメツセージ表示により、学習打ば111一度
発声を繰り返すこととなる。従って。
不慣れな学習者によっては1度々同一単語を3回以上発
声することも生ずる。そのため、予め、不慣れな学習者
について、単音節発声トレーニングを行い、その発声を
学習モードにより発声不良表示が減少するまで学習を繰
り返し行われる。
しかし、この従来のトレーニングモードの学習において
、!1lIlt散的な単音節発声に2本来かなり曖昧な
部分かあり、音声登録時と実際に利用している時との発
声の差が、そのまま認識率低下を招くことになる。従っ
て、単音節登録パターンとしては、実際の発声の時のも
のに近い方が望ましいが。
このようなことを行うにも、どの範囲までの単語でトレ
ーニングするかが問題であり、若し、仮に。
実際の発声の時のものに近い単語が1000語あると仮
定した場合、 1000語を1詔宛順番に発声してトレ
ーニングを行うことば2時間の浪費でありまた実際的で
はない。更に、実際に利用する時の認識率が向上するか
どうか疑問であり、自ずと限界がある。従って、曖昧な
部分のある1i311敗的な単音節発声を繰り返すトレ
ーニングを行い、その成果を学習モードで確認すること
となる。その為、従来の!11語のtQ音節標準パター
ンを登録する学習方法は、学習時間を費やす割に学習効
果が上がらない欠点を有していた。
fdl 発明の目的 本発明は、この学習時間を費やす割に学習効果が」二か
らない従来の欠点を解決し、効率的な学習により認識率
が向上する単音節音声学習方式を提供することを目的と
している。
+e+ 発明の構成 一ト記1]的は、入力単音節音声の特徴パラメータを抽
出するパラメータ抽出手段と、抽出された特徴パラメー
タを記憶する記憶手段と、前記記11手段により記憶さ
れた特徴パラメータとその後に入力される単音節音声の
特徴パラメータとの類似度を照合する照合手段と、同類
の単音節の単語同志を諸量として集めて複数の講堂群と
して格納した語量”辞書と、前記照合手段の結果により
前記諸量辞7:より単音節を含む同類の諸量を抽出する
語量抽出手段と、抽出された諸量をメツセージ表示する
表示手段とを有する日本語音声入力による単音節音声認
識装置であって、入力音声のf1i音節音声パj!゛習
におむゾ乙人力されるrli音節音声を前記抽出手段に
より特徴パラメータとし一ζ抽出し、抽出されたq、!
1徴パラメータを前記記10手段にまり記IQし、前記
記1.a手段により記憶された特徴パラメータとその後
に入力される単音節音声の特徴パラメータとを前記照合
手段で照合し、前記照合手段による照合結果かある類似
度量]・の場合に、前記照合手段による照合結果を前記
講堂抽出手段に入力し、前記講堂抽出手段により前記諸
量辞宿よりlJλ音節を含む有意味な同類の語♀を抽出
し、抽出された諸量を前記表示手段によりメソセージ表
示するよう構成した本発明によって達成される。
即ち1日本語音声入力による単音節音声認識装置におい
て、入力される単音節音声を抽出手段により特徴パラメ
ータとして抽出し、抽出された特徴パラメータを記1.
a手段により記憶し、記↑、aされた特徴パラメータと
その後に入力される単音節音声の特徴パラメータとを照
合手段で照合し、その照合結果がある類似度以下の場合
は7語量抽出手段により語量辞書より同類の諸量を抽出
し、抽出された諸量を表示手段によりメツセージ表示す
るよう構成することにより、トレーニングモードでの学
;I!1を実施する場合に5その人の単音節の誤り方か
ら 8!l↓りやすい単音節を抽出し、抽出されたfl
音節に対して、その単音節を多く含むような語量を語り
:辞書から抽出しζメツセージ表示され。
その語堂を発声さ・Uることに、J、す、より実際に近
い発声の単音節音声パターンを学習することができるた
め、 i;JJ率的な学習により認識率が向上する1「
(11節、合点学習方式を提供するものである。
(「)発明の実施例 以下本発明の一実施例について説明する。第2図は本発
明による誤りゃすい単音節音声を抽出する構成図を示し
、同一対象物は第1図と同一符号で示す。21は単音節
バッファメモリ、22は語當辞吉、23は超電作成部を
示す。単音節バッファメモリ21は誤りゃすい単音部名
を一時格納するバッファメモリ、超電辞書22は同類の
単音節の単語を類別に諸量として登録されている辞書2
諸量抽d」部23は単音節パンツアメモリ21に一時格
納されたQi音節名を取り出し、その単音節を多く含む
ような語学を語学辞書22から抽出する回路である。
第2図において、切替スイッチ5以前の構成は第1図゛
と同様なので省略しである。また、認識判定部9で離散
単音節音声の単音部名を認識し、登録不良の単音部名を
出力するまでは、前記述と同様なので省略する。音声登
録時は、学習者は従来同様3回発声する。その内の1回
は前記連間様の1条路で単音節辞書6に単音節標準パタ
ーン6aとして登録するが、2回目以降については、認
識判定部9で認識しながら、前記述同様平均化・追加学
習を行っていくと同時に、認識判定部9で発声不良の単
音節学習パターンの単音部名を単音節パンツアメモリ2
1に一時格納する。この単語単位での単音節学習による
トレーニングモードの結果から。
単音節パンツアメモリ21に格納された単音部名を語学
抽出部23で読み出し、誤りやすい単音節を多く含む諸
量を語学辞書22より抽出し、トレーニングで学M”H
に発声してもらう単語をディスプレイ1】に表示する。
このディスプレイ11に表示された発声語学の単語を発
声し1発声された単語の単音節に対し°ζ、単音節標準
パターンに対する学習を行うものである。即ち、トレー
ニングモートで。
音声登録時の認識結果で認識率のよくない単音節を抽出
したものを元に、その単音節を多く含む諸量を語学辞書
より探し出し、その人にとって、誤りやすい単音節に対
してのみ発声さセることにより2効イシ的な学習ができ
ると共に、より実際に近い発声の音声パターンを学習す
ることとなり、実際に使用する場面での音声に近い標準
パターンを作成することができ、認識率も向上する。
(8)発明の効果 以」二説明したように1日本語音声入力による単音節音
声認識装置において、入力される単音節音声を抽出手段
により特徴パラメータとして抽出し、抽出された特徴パ
ラメータを記憶手段により記憶し、記憶された特徴パラ
メータとその後に入力される単音節音声の特徴パラメー
タとを照合手段で照合し、その照合結果がある頬似度以
下の場合は1語党抽出手段により語学辞書より同類の語
党を抽出し、抽出された諸量を表示手段によりメツセー
ジ表示するよう構成した本発明により、トレーニングモ
ードでの学習を実施する場合に、その人の単音節の誤り
方から 、 H!4りやすいfl!音節を抽出し、抽出
された単音節に対して、その単音節を多く含むような語
学を語学辞書から抽出してメソセージ表示されるので、
その語学を発声さ−lることにより、より実際に近い発
声の単音節音声パターンを学習することができるため、
効率的な学習により認識率が向上するリノ果がある。
【図面の簡単な説明】
第1図は従来の音声認識装置の学習モードtlyにおり
る構成ブロック図、第2図は本発明による誤りやすい単
音節音声を抽出する構成ブロック図を示す。 図面において、5は切替スイッチ、6は単音節辞書、 
6a−6nは単音節標準パターン、 7aと7bは特徴
パラメータバッファ、8は単音節照合部、9は認識判定
部、10はパターン平均化部、11はディスプレイ、2
1は単音節バッファメモリ、22は語学辞書、23は語
学抽出部をそれぞれ示す。

Claims (1)

  1. 【特許請求の範囲】 入力単音節音声の特徴パラメータを抽出するパラメータ
    抽出手段と、抽出された特徴パラメータを記憶する記憶
    手段と、前記記憶手段により記憶された特徴パラメータ
    とその後に入力される単音節會声の特徴パラメータとの
    類似度を照合する照合手段と、同類の単音節の単語同志
    を諸量として築めて複数の倍量群として格納した諸量辞
    書と。 前記照合手段の結果により前記講堂辞書より単音節を含
    む同類の諸量を抽出する倍量抽出手段と。 抽出された語堂をメソセージ表示する表示手段とを有す
    る日本語音声入力による単音節音声認識装置であって、
    入力音声の単音節音声学習において。 入力される単音節音声を前記抽出手段により特徴パラメ
    ータとして抽出し、抽出された特徴パラメータを前記記
    憶手段により記憶し、前記記憶手段により記憶された特
    徴パラメータとその後に入力される単音節音声の特徴パ
    ラメータとを前記照合手段で照合し、前記照合手段によ
    る照合結果がある類似度以下の場合に、前記照合手段に
    よる照合結果を前記」ル党抽出手段に入力し、前記諸量
    抽出手段により前記超電辞書より単音節を含む有意味な
    同類の語堂を抽出し、抽出された超電を前記表示手段に
    よりメツセージ表示するよう構成したことを特徴とする
    単音節音声学習方式。
JP59026413A 1984-02-15 1984-02-15 単音節音声学習方式 Pending JPS60170885A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59026413A JPS60170885A (ja) 1984-02-15 1984-02-15 単音節音声学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59026413A JPS60170885A (ja) 1984-02-15 1984-02-15 単音節音声学習方式

Publications (1)

Publication Number Publication Date
JPS60170885A true JPS60170885A (ja) 1985-09-04

Family

ID=12192859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59026413A Pending JPS60170885A (ja) 1984-02-15 1984-02-15 単音節音声学習方式

Country Status (1)

Country Link
JP (1) JPS60170885A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161498A (ja) * 1986-12-25 1988-07-05 株式会社東芝 音声情報入力装置
JP2012063542A (ja) * 2010-09-15 2012-03-29 Toshiba Corp 文章提示装置、文章提示方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63161498A (ja) * 1986-12-25 1988-07-05 株式会社東芝 音声情報入力装置
JP2012063542A (ja) * 2010-09-15 2012-03-29 Toshiba Corp 文章提示装置、文章提示方法及びプログラム
US8655664B2 (en) 2010-09-15 2014-02-18 Kabushiki Kaisha Toshiba Text presentation apparatus, text presentation method, and computer program product

Similar Documents

Publication Publication Date Title
JP3520022B2 (ja) 外国語学習装置、外国語学習方法および媒体
CN108431883B (zh) 语言学习系统以及语言学习程序
CN106328146A (zh) 一种视频的字幕生成方法及装置
US20080004879A1 (en) Method for assessing learner's pronunciation through voice and image
Kabashima et al. Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings
JP2001249679A (ja) 外国語自律学習システム
JPS60170885A (ja) 単音節音声学習方式
JPH09319297A (ja) 音声筆談器
JP3621624B2 (ja) 外国語学習装置、外国語学習方法および媒体
KR101004940B1 (ko) 음성인식을 활용한 컴퓨터 주도형 말하기 능력 평가방법
CN111508523A (zh) 一种语音训练提示方法及系统
TWI731493B (zh) 多語語音辨識及主題語意分析方法與裝置
JPH0736481A (ja) 補完音声認識装置
KR100570262B1 (ko) 발음의 유창성을 평가하는 방법
JPS60245000A (ja) 発声訓練装置
Li et al. Education of Recognition Training Combined with Hidden Markov Model to Explore English Speaking
JPH01300334A (ja) 文章読み上げ装置
JPS60244989A (ja) 発音訓練機
CN118410813A (zh) 一种语言学习方法、系统及存储介质
KR19990050440A (ko) 유성음, 무성음, 묵음 구간 정보를 이용한 음성인식방법 및 음성인식장치
JPH1165410A (ja) 発音練習装置
Roux On vowel identification and phonological theory
JPS61107373A (ja) 発声訓練装置
JPS61100833A (ja) 発声訓練装置
JPS61102684A (ja) 聴覚障害者用発声訓練装置