JPS60170899A - 単語音声登録方式 - Google Patents

単語音声登録方式

Info

Publication number
JPS60170899A
JPS60170899A JP59026415A JP2641584A JPS60170899A JP S60170899 A JPS60170899 A JP S60170899A JP 59026415 A JP59026415 A JP 59026415A JP 2641584 A JP2641584 A JP 2641584A JP S60170899 A JPS60170899 A JP S60170899A
Authority
JP
Japan
Prior art keywords
word
similarity
pattern
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59026415A
Other languages
English (en)
Inventor
寺尾 修
田村 鉄夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59026415A priority Critical patent/JPS60170899A/ja
Publication of JPS60170899A publication Critical patent/JPS60170899A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (al 発明の技術分野 本発明は、特定話者による限定単語を認識対象とする単
語音声認識装置におけるi語音声登録方式に関する。
(bl 技術の背景 近来、音声認識技術はデータ処理技術の発達と、音声認
識アルゴリズムのための複雑高度な論理回路、及び高速
大容量を要する手段等が、半導体築積化技術の進展によ
る小型化・低コストの高集積回路素子(LSI)の実現
により可能となり。
日本語音声によるデータ処理が容易にできる日本語音声
入力の音声認識装置が実用化されてきた。
特に、特定話者による音声を認識する音声認識装置につ
いては、音声認識率が向上し各分野で使用されているが
、この特定話者による限定単語を認識する単語音声登録
方法は、その人による癖。
訛、その時の体調等により、単音節音声の音声標準パタ
ーンを登録しても、実際に使用する場合の音声とではか
なり異なる場合が存在することが多く、認識率に差が生
ずる結果となり、トレーニングモードでの学習を能率的
に行い、単語の音声標準パターンを如何に正しく登録す
るかが認識率を左右する1つの要素でもある。
(C1従来技術と問題点 従来の、この種の特定話者による音声認識装置について
説明する。第1図は従来の音声認識装置のブロック図を
示す。まず、特定話者が複数の単語を発声してその単音
節音声を登録する場合。
ある単語を指定してその単語の表記と特定話者によるl
i語音声を入力し、特定話者が数回同一単音節の11χ
語を発声するようにしているが2本例では説明を節単に
するため、3回発声するものとする。
マイクl」ホン1からある単語を発声し、その1回目の
音声を音声分析部2に入力する。音声分析部2に人力さ
れた1回目の1i詔音声は複数の帯域フィルター群に印
加して複数のスペクトルを出力し。
この複数のスペクトルを特徴パラメータ抽出部3に入力
する。特徴パラメータ抽出部3に入力された複数のスペ
クトルを数ms程度のフレーム同期で標本化し、線形時
間正規化して単音節の特徴パラメータ時系列を抽出して
特徴パラメータバッファ4に入力する。この入力された
特徴パラメータ時系列は一旦特徴パラメータバッファ4
に格納される。特徴パラメータハ・ノファ4に格納され
た特徴パラメータ時系列は、切替スイッチ5の実線側を
通して、単語セントファイル6の単Jもセントメモリ6
aに設定単語の音声標準パターンとして登録される。次
に、2回目と3回目は切替スイッチ5を学習モード側(
点線側)に切替え、2回目と3回目の音声をマイクロホ
ン1に入力し、上記同様の径路で2回目と3回目の特徴
パラメータ時系列を。
切替スイッチ5の学習モード側を介し′ζ順次入力パタ
ーンバッファ7a、 7bに学習パターンとして格納す
る。続いて、この入力パターン平均化部7a。
7bに格納された学習パターンと、単語セントファイル
6の単語セントメモリ6aに先に登録されていた音声標
準パターンとをパターン照合部8で照合し、パターン照
合部8の照合結果の照合類似度を認識判定部9に入力す
る。認識判定部9内のモード切替スイッチ10は学習モ
ード側(実線側)にし。
認識判定部9で規定の類似度以上の場合はパターン平均
化部11に平均化する指示を与え、パターン平均化部1
1で学習パターンと登録されていた音声標準パターンと
を平均化処理を行い、パターン平均化部11より平均化
された音声標準パターンを単語セントファイル6の単語
セントメモリ6aに入力し、単語セットメモリ6aの内
容を更新し書き換え処理が行われる。次に、3回目の学
習パターンバッファ7bに格納されていた学習パターン
も上記同様の手順で照合が行われ、平均化指示が与えら
れれば、先に登録されていたff1語セントメモリ6a
の音声標準パターンと、3回目の学習パターンとをパタ
ーン平均化部11で更に平均化処理を行い、単語上ソ1
−メモリ6aの内容を再度書き換え更新する。
従って、2回目と3回目の学習パターンの類似度が共に
規定の類似度以上の場合は、単語セントファイル6の単
語セントメモリ6aは、3個を平均化した音声標準パタ
ーンとして登録されることとなる。
しかし、認識判定部9は誤認識を避けるため。
類似度を監視する監視機能を持っており、類似度がある
闇値を越えた時のみパターン平均化部11に平均化指示
を与え、闇値以下の時はパターン平均化部11には指示
しない。即ち1例えば、類似度「100」を完全一致と
し、闇値を「90」と設定した場合、ある単語入力音声
の類似度がパターン照合部8で185」とめられれば、
認識判定部9の判定は判定不良となり平均化処理は行わ
れず、ディスプレイ12に発声不良のメソセージ表示を
行う。
従って、再度単語を発声して学習が行われる。
以」二の学習処理を登録する必要な単語数だDJ繰り返
し行って、単語上ノドファイル6の単語セ・ノドメモリ
6a−6nにそれぞれ指定の音声標準パターンが登録さ
れ、n(lliI分の単語が登録されて学習完了となり
単語セント辞書が出来上がる。
引続き、特定話者のトレーニングモードにより音声登録
された単語セント辞古を認識する場合。
切替スイッチ5は学習モード側のままで、認識判定部9
内のモード切替スイッチ10をトレーニングモード側(
点線側)に切替え、単語音声をマイクロホンlより入力
し、前記連間様の径路で入カバターンバッファ7aに被
認識パターンが一時格納される。この一時格納された被
認識パターンと単語セントファイル6の単語セントメモ
リ6a−6n内のn個の各単語セントとをパターン照合
部8で順次照合し、各単語セント毎の照合結果のn個の
類似度を認識判定部9に入力する。認識判定部9では入
力されたn個の類似度中より最大の類似度を持った音声
標準パターンを選択し2その単語をディスプレイ】2の
画面上に表示する。この表示により音声登録された単語
セット辞書が適正に行われたかどうかが確認される。
以上が従来の音声認識装置における特定話者による限定
単語の登録と、トレーニング手順であるが、その人によ
る癖、訛、その時々の体調等により、登録された単語音
声が不十分な音声標準パターンであれば、実際に利用す
る際の音声とではかなり異なる場合が存在することが多
く、認識率低下を招き誤認識が多発することとなる。従
って。
トレーニングモード時にその確認を行っているものの、
不十分な音声標準パターンが多ければ、トレーニングモ
ードなのか学習モードなのか混乱をきたし、結果的に、
実際に利用する際の認識率低下を招く欠点を有していた
(d+ 発明の目的 本発明は、単語の音声登録を行う際に、不十分な音声標
準パターンを事前にチェック確認する機能を設け、従来
の欠点を改善して高い認識率を得ることを目的としてい
る。
tel 発明の構成 上記目的は、特定話者による複数11?Jの単語入力音
声を入カバターンに変換して複数個の単語セント辞書に
単語標準パターンとして登録し、前記複数個の単語セン
ト辞書に登録された単語標準パターンと該特定話者によ
る単語入力音声の入カバターンとを照合し類似度をめる
照合手段と、予め、各単語の単音節間の類似度を統計的
にめた類似度テーブルと、各単語の読みを単音節単位の
文字列から単音節に対する類似度を前記類似度テーブル
から仮想類似度を作成する作成手段と、前記照合手段で
得られた類似度と前記作成手段により作成された仮想類
似度とを比較検証する比較検証手段と、前記比較検証手
段により比較検証された検証結果を通知する通知手段と
を有し、該特定話者の未知入力音声を前記複数個の単−
へセント辞書に登録した単語標準パターンと照合して認
識する限定単語音声認識装置であって、該特定話者の単
語音声を単語標準パターンとして前記複数個の単語セン
ト辞書に登録した後、各単語のトレ−ニングを行う時G
ご、前記照合手段により得られた類イ以度と1mI記作
成手段により作成された仮想類似度とを前記比較検証手
段で比較検証し、前記比較検証手段の比較検証結果があ
る値を越えた場合に。
前記通知手段により該当単語の音声登録の標準パターン
の再登録を通知するよう構成した本発明によって達成さ
れる。
即ち、特定話者の未知入力音声を複数個の単語セット辞
別に登録された音声標準パターンと照合して認識する限
定R語音声認識装置において、予め、登録単語の読みか
らその単音節間の類似度統計テーブルにより各単語毎の
仮想類似度を作成手段によりめておき、特定話者の単語
音声を複数個の単語セント辞書に登録した後、各単語の
トレーニングを行う時に、照合手段により得られた類似
度と2作成手段により作成された仮想類似度とを比較検
証手段で比較検証し、比較検証結果がある値を越えた場
合に、該当単語を再登録するよう通知する通知手段とで
構成することにより、この仮想類似度を基にしてトレー
ニングモードでの単語認識結果の類似度の検証を行い、
トレーニングモードでの検証結果により音声登録パター
ンを再登録するか、そのパターンに平均化学習を行わせ
るかを自動的に判定し通知するため、混乱なく事前に高
い認識率を得る音声標準パターンを再登録することがで
き、実際に使用する時の認識率が向上する単語登録方式
を提供するものである。
ffl 発明の実施例 以下本発明の一実施例について説明する。第2図は本発
明による類似度を比較検証する機能を持った特定話者に
よる単語音声認識装置の構成ブロック図を示し、同一対
象物は第1図と同一符号で示す。21ば類似度統計テー
ブル、22は仮想類似度作成部、23は仮想類似度格納
部、24は比較検証部を示す。類似度統計テーブル21
は予め各単語の単音節間の類似度を統言1的に作成した
統計表を格納したテーブルであり、仮想類似度作成部2
2ば各単語の読みを単音節の文字列に区分し、その単音
節に対する類似度を類似度統計テーブル21から仮想類
似度を作成する計数回路であり3例えば、市川では「い
ちかわ」の文字列での類似度、即ち。
「い−い」、[ち−ち」、「か−か」、「わ−わ」での
類似度の総和を正規化して仮想類似度をめる。仮想類似
度格納部23は仮想類似度作成部22で作成された各単
語毎の仮想類似度を各々格納するメモリである。比V、
検址部24はパターン照合部8で照合し、認識判定部9
に入力された類似度と。
仮想類似度格納部23に格納されている該当する単語の
仮想類似度を読み出して比較検証する回路である。
第2図において、単語セントファイル6の単語セットメ
モリ6a−6nに単語を音声標準パターンとして登録す
るまでの構成ブロック図と、その手順は、前記述と同様
なので省略する。まず、予め。
仮想類似度格納部23には仮想類似度作成部22により
、各単語の読みの単音節に対する類似度を類似度統計テ
ーブル21からめ1作成した各単語毎の仮想類似度を格
納しておく。次に、特定話者により単語セント毎に単語
セントメモリ6a−6nに単語登録が完了し、認識゛1
′す足部9のモード切替スイッチ10をトレーニングモ
ードに切替え、トレーニングモードで単語の読みを入力
し、特定話者が音声を入力することにより、パターン照
合部8での類似度結果を認識判定部9を介して比較検証
部24に入力する。比較検証部24は認識判定部9から
入力した類似度と、仮想類イ以度格納部23に格納され
ている該当単語の仮想類似度を読み出して比較検証し、
比較検証結果がある値以上で明らかに単語の音声登録パ
ターンに問題がある時には、該当単語の再登録指示のメ
ンセージをディスプレイ12に表示し特定話者に通知す
る。特定話者は再度前記述同様の登録学習モードによる
再登録を行う。比較検証結果がある値以内である時はト
レーニング学習を続行する。このようにして、単語の標
準パターンの検証を順次行うものである。
以上のように、予め、単語登録における単語の読みから
、その単音節間の類似度テーブル表により各単語毎の仮
想類似度をめておき、この仮想類似度を基にしてトレー
ニングモードでの単語認識結果の類似度の検証を行うも
ので、トレーニングモードでの評価結果により音声登録
パターンをiff登録させるか、そのパターンに平均化
学習を行わせるかを判定して特定話者に通知し、より正
確な音声標準パターンを登録する機能を持った単語音声
登録方式である。
(gl 発明の効果 以に説明したように、特定話者の未知入力音声を複数個
の単語セント辞書に登録された音声標準パターンと照合
して認識する限定単語音声認識装置において、予め、登
録車5石の読みからその単音節間の類似度統計テーブル
により各単語毎の仮想類似度を作成手段によりめておき
、特定話者の単語音声を複数個の単語セント辞書に登録
した後、各単語のトレーニングを行う時に、照合手段に
よりIMられた類似度と2作成手段により作成された仮
想類似度とを比較検証手段で比較検証し。
比較検証結果がある値を越えた場合に、該当単語を再登
録するよう通知する通知手段とで構成した本発明により
、この仮想類似度を基にしてトレーニングモードでの単
語認識結果の類似度の検証を行い、1−レーニングモー
トでの検証結果により音声登録パターンを再登録するか
、そのパターンに平均化学習を行わせるかを自動的に判
定し通知するため、混乱なく事前に高い認識率を得る音
声標準パターンを再登録することができ、実際に使用す
る時の認識率が向上する効果がある。
【図面の簡単な説明】
第1図は従来の特定話者による音声認識装置の構成ブロ
ック図、第2図は本発明による類似度を比較検証する機
能を持った特定話者による単語音声認識装置の構成ブロ
ック図を示す。 図面Qごおいて、5は切替スイッチ、6は単語セントフ
ァイル、 6a−6nは単語セソI・メモリ、78゜7
bは学習パターン平均化部、8はパターン照合部。 9は認識判定部、10はモード切替スイッチ、 11は
パターン平均化部、12はディスプレイ、21は類似度
統計テーブル、22ば仮想類似度作成部、23は仮想類
似度格納部、24は比較検証部をそれぞれ示す。 寥 1 (転) 秦2 口

Claims (1)

  1. 【特許請求の範囲】 特定話者による複数個の単語入力音声を入カバターンに
    変換して複数個の単語セント辞書に単語標準パターンと
    して登録し、前記複数個の単語セット辞書に登録された
    単語標準パターンと該特定話者による単語入力音声の入
    カバターンとを照合し類似度をめる照合手段と、予め、
    各単語の単音節間の類似度を統計的にめた類似度テーブ
    ルと、各単語の読みを単音節単位の文字列から単音節に
    対する類似度を前記類似度テーブルから仮想類似度を作
    成する作成手段と、前記照合手段で得られた類似度と前
    記作成手段により作成された仮想類似度とを比較検証す
    る比較検証手段と、前記比較検証手段により比較検証さ
    れた検証結果を通知する通知手段とを有し、該特定話者
    の未知入力音声を前記複数個の単語セット辞書に登録し
    た単語標準パターンと照合して認識する限定単語音声認
    識装置であって、該特定話者の単語音声を単語標準パタ
    ーンとして前記複数個の単語セント辞書に登録した後、
    各単語のトレーニングを行う時に。 前記照合手段により得られた類似度と、前記作成手段に
    より作成された仮想類似度とを前記比較検証手段で比較
    検証し、前記比較検証手段の比較検証結果がある値を越
    えた場合に、前記通知手段により該当単語の音声登録の
    標準パターンの再登録を通知するよう構成したことを特
    徴とする単語音声登録方式。
JP59026415A 1984-02-15 1984-02-15 単語音声登録方式 Pending JPS60170899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59026415A JPS60170899A (ja) 1984-02-15 1984-02-15 単語音声登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59026415A JPS60170899A (ja) 1984-02-15 1984-02-15 単語音声登録方式

Publications (1)

Publication Number Publication Date
JPS60170899A true JPS60170899A (ja) 1985-09-04

Family

ID=12192908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59026415A Pending JPS60170899A (ja) 1984-02-15 1984-02-15 単語音声登録方式

Country Status (1)

Country Link
JP (1) JPS60170899A (ja)

Similar Documents

Publication Publication Date Title
US6389395B1 (en) System and method for generating a phonetic baseform for a word and using the generated baseform for speech recognition
JP4672003B2 (ja) 音声認証システム
KR0135975B1 (ko) 텍스트 처리 시스템
JPH0713594A (ja) 音声合成において音声の質を評価するための方法
JPS62232691A (ja) 音声認識装置
US20230298564A1 (en) Speech synthesis method and apparatus, device, and storage medium
CN110298150B (zh) 一种基于语音识别的身份验证方法及系统
JPS6332394B2 (ja)
JPS60170899A (ja) 単語音声登録方式
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JPH0736481A (ja) 補完音声認識装置
JPS59195299A (ja) 特定話者音声認識装置
KR960001950B1 (ko) 음성인식방법 및 그 장치
JPS61239358A (ja) 音声入力による文書作成方式
JPS6386652A (ja) 電話着呼情報提供システム
JPS6059395A (ja) 音声標準特徴パタ−ン作成処理方式
JPS60169900A (ja) 単語登録方式
JPS5961893A (ja) 標準パタ−ン更新機能付音声入力装置
JPS63155195A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS60115993A (ja) 単音節音声認識装置
JPS63118198A (ja) 音声認識装置
JPS5962900A (ja) 音声認識方式
JPS6312000A (ja) 音声認識装置
JPS6011897A (ja) 音声認識装置