JPS593491A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS593491A
JPS593491A JP57111891A JP11189182A JPS593491A JP S593491 A JPS593491 A JP S593491A JP 57111891 A JP57111891 A JP 57111891A JP 11189182 A JP11189182 A JP 11189182A JP S593491 A JPS593491 A JP S593491A
Authority
JP
Japan
Prior art keywords
speech
dictionary
voice
speaker
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57111891A
Other languages
English (en)
Inventor
松井 春樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57111891A priority Critical patent/JPS593491A/ja
Publication of JPS593491A publication Critical patent/JPS593491A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、予め登録する方式の音声認識装置特にその音
声辞書に関する。
技術の背景 音声認識は発声者の音声を分析して当該音声の特徴を示
すパラメータを抽出し、それを音声辞書内に格納されて
いる音声パラメータ群と比較して一致した又は距離が近
い辞書内音声パラメータに対応する辞書内登録言葉とし
て発声者音声を認識する、という手法をとるのが普通で
ある。また音声辞書は何人にも通用する汎用のものを作
成するとデータ量が膨大になり、比較及び該当言葉の抽
出が困難になるので、当該発声者専用のものとするのが
現状である。この場合は最初に該発声者が種々の言葉を
キーインすると共に発声し、認識装置にそれを分析、特
徴抽出して該キーインデータと共にメモリに記憶させて
当該発声者の音声辞書を作らせ、換言すれば音声登録し
、然るのち当該発座者は単に発声のみし、装置にそれを
認識させるという工程をとる。
従来技術と問題点 この登録型の音声g織では発声者音声に密着した辞書を
用いるので認識が容易で正解度も高い(本来なら100
%)が、発声者音声も特に特徴パラメータで見ると不変
というものではなく、その時の発声の仕方、健康状態そ
の他により変化する。
従って該当する言葉には候補が幾つも挙がるという例が
多く、これには選択した候補を音声で認識装置が発声者
に通知し、確認を求めるという方法をとることが考えら
れている。この方法は発声者による判定を待つので正確
ではあるが、認識装置が知らせた言葉が誤っておれば当
然法の候補を提示して確認を求める、場合によっては再
入力を求めることになり、煩雑であるから、認識率その
ものの向上が望まれる。
発明の目的 本発明は音声辞書に学習機能を付して該辞書を常に発声
者音声に密着した最新の辞書に更新させ、認識率を向上
させようとするものである。
発明の構成 本発明は発声者の音声辞書を備えて発声者の入力音声か
ら求めた音声パラメータを該辞書内音声パラメータと比
較し、距離が近い辞書内音声パラメータに対応する音声
を当該入力音声に対応する言葉と判断して発声者に確認
を求める音声認識装置において、誤認識が行なわれたと
き該音声辞書の音声パラメータを修正及び又は削除する
手段を備えることを特徴とするが、次に実施例を参照し
ながらこれを説明する。
発明の実施例 第1図は音声パラメータP1.P2で表わした音声又は
言葉10.20の音声パラメータの分布状況を示す。音
声10は例えば「東京」、音声20は例えば「大阪」で
あり、11.12は発声者が「東京」を発声してat織
装置に登録した該「東京」に対応する音声パラメータで
ある。発声者が「東京」と発声すると、その音声信号は
音声周波数帯を多数に区分例えば200〜5000Hz
を16チヤンネルに分割する各バンドパスフィルタに通
され、該音声が継続する時間の間、短い周期のクロック
でサンプリングされ、低域パワー、高域パワー、変動量
・・・・・・毎に特徴抽出され、登録の際は辞書メモリ
に格納される。第2図はその模様を説明する図で、t 
++  t2・・・・・・tmは第1.第2・・・・・
・第mサンプリングタイミング、Pl、P2・・・・・
・Pnはそのとき抽出された第1.第2・・・・・・第
n音声パラメータの数値であり、第1図の11は本来こ
のt1〜tn +  P + −P n内のデータを示
すものであるが、第1図ではこれを簡略化して2ノ寸ラ
メータPI、P2を示すものとしている。ノマラメータ
はn個であるから実際はn次元となり時間を考慮すると
更に多次元で表示されるべきものである。11.12は
発声者が「東京」と2回発声して音声登録したその各回
畳録′データであるが、音声辞書は各音声又は言葉別に
か−る登録データを2個ないし4個持つのが普通である
。本fFJで番よこれを2個としており、音声10「東
京」につG1ては11,12.音声20「大阪」につい
ては21.22がそれである。各音声についての登録デ
ータ数は2なら2と一定にしておく。音声パラメータに
対応する音声又は言葉は図示のように当該音声パラメー
タと同じメモリ領域に記憶させておく、あるいは別にテ
ーブルを用意して各音声又は言葉は、当該音声パラメー
タの記憶領域のアドレスと共に該テーブルに格納する。
か−る辞書を用いて発声者が今度は音声認識のために「
東京」と発声すると、その音声信号は識別装置で周波数
分割、サンプリング、特徴抽出され、例えば第1図に1
3で示す音声パラメータとして把握される。音声パラメ
ータ13は音声辞書内の全パラメータと比較され、距離
計算される。
本例では最も近いものはパラメータ21であるから認識
装置は「大阪」ですかと尋ねることになる。
発声者は勿11!INOと答え(これは音声で又はキー
操作で行なう)そこで認識装置は次の候補12を取上げ
て「東京」ですかと尋ねる。発声者は今度はrYEsJ
と答え、次の言葉の発声に入いるが、本発明ではこの際
辞書修正を行なう。即ち遠かつたが正解であった辞書内
音声パラメータ12を今回入力音声パラメータ13に近
付け、近いが誤解であった辞書内音声パラメータ21を
パラメータ13より遠去ける。その程度は辞書パラメー
タを優先させて、にNの内分で12を13の方へ僅かに
近付けまた21は1:Mの外方で21より僅かに遠去け
るようにする。一般的に表現すると、点12,13.1
4の音声パラメータベクトルをIPI 2.  IPI
 3.  IPI 4として、次式で表わされるベクト
ルIP14を持つ点14へ点12を移動させる。
N+1 また点P21.P23の音声パラメータベクトルをIF
51.  IF53として次式で表わされるベクトルI
P23を持つ点23へ点21を移動させる。
−1 このような走査を繰り返してゆくと辞書内の音声10の
パラメータは音声1oの最新入力パラメータに接近し、
辞書内の音声2oのパラメータは同10のパラメータよ
り離れ、誤認識率を低減し正認識率を高めることができ
る。なお上記例ではパラメータ12を修正して、パラメ
ータ11は放置したが、11も13に接近させる修正を
してもよく、このようにすると辞書内音声パラメータ群
11.12は常に最新入力音声パラメータ13等の近傍
へ集中して行く傾向を持つようになる。
上記のように加重平均で辞書パラメータを修正すること
の他に誤認識の原因となった音声パラメータを削除する
ことも効果的である。例えば第1図では入力音声パラメ
ータ13にとって21が12より近いので誤認識を生じ
たのであるが、が\る点21による誤認識回数を計数し
それが所定値(闇値)以上になったら点21を消去する
、そして音声20に対する入力があったときそれを辞書
パラメータに加え、消去した点21の穴うめをする。こ
の場合は全ての辞書パラメータ11,12゜21.22
・・・・・・に対してIIIg織の原因となった回数の
計数値を記録しておき、該計数値が闇値を越えたとき当
該辞書パラメータを消去する。
辞書パラメータの登録時の本計数値は当然零としておき
、誤認識の原因となる毎に+1する。正解を与えた場合
は一エする事も合理的である。
またこの辞書パラメータ消去法は前述の加重平均による
辞書パラメータ修正法と併用してもよく、この場合は内
分による修正が行なわれたら即ち前記例では点12が点
14に移動したら該12(今は14に移動している)の
針数値は零とし、また外分による修正即ち前記の例では
点21の23への移動はさせないで点21のま\とし、
誤認識原因となる毎に計数値を+工して闇値になったら
点21を消去する。更に上記の内分修正で計数値を零に
戻す際は、修正すれば針数値は必ず零復帰させる代りに
入力音声パラメータとの距離を計算し、それが大である
場合は計数値はそのま\とじてもよい。この場合は内分
修正を受けている間に計数値が闇値に達して消去となる
ケースも出てくる。
発明の詳細 な説明したように本発明では誤認識が生しる毎に発声者
音声辞書を修正し、又は削除して更新するので、該辞書
は常に発声者音声に密着したものとなり、認識率を向上
させることができる。
【図面の簡単な説明】
第1図および第2図は本発明の説明図である。 図面で、11,12,21.22は辞書内音声パラメー
タ、10.20は該パラメータに対応する音声又は言葉
、14.23は12.21の修正後のパラメータを示す
。 出願人 富士通株式会社 代理人弁理士  青  柳    稔

Claims (3)

    【特許請求の範囲】
  1. (1)発声者の音声辞書を備えて発声者の入力音声から
    求めた音声パラメータを該辞書内音声バラメークと比較
    し、距離が近い辞書内音声パラメータに対応する音声を
    当該入力音声に対応する言葉と判断して発声者に確認を
    求める音声認識装置において、誤認識が行なわれたとき
    該音声辞書の音声パラメータを修正及び又は削除する手
    段を備えることを特徴とする音声認識装置。
  2. (2)修正が、入力音声パラメータと当該入力音声に対
    する辞書内音声パラメータとの距離を所定比で内分する
    新音声パラメータへ該辞書内音声パラメータを変更する
    ように行なわれることを特徴とする特許請求の範囲第1
    項記載の音声認識装置。
  3. (3)削除が、誤認識の原因となった回数が闇値を越え
    るとき当該入力音声パラメータを消去するようにして行
    なわれることを特徴とする特許請求の範囲第1項記載の
    音声認識装置。
JP57111891A 1982-06-29 1982-06-29 音声認識装置 Pending JPS593491A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57111891A JPS593491A (ja) 1982-06-29 1982-06-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57111891A JPS593491A (ja) 1982-06-29 1982-06-29 音声認識装置

Publications (1)

Publication Number Publication Date
JPS593491A true JPS593491A (ja) 1984-01-10

Family

ID=14572727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57111891A Pending JPS593491A (ja) 1982-06-29 1982-06-29 音声認識装置

Country Status (1)

Country Link
JP (1) JPS593491A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS6199195A (ja) * 1984-10-02 1986-05-17 富士通株式会社 音声標準パタン作成処理方法
JPS6199197A (ja) * 1984-10-02 1986-05-17 富士通株式会社 音声標準パタン作成処理方法
JPH04293097A (ja) * 1991-03-22 1992-10-16 Sharp Corp 話者識別装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS6199195A (ja) * 1984-10-02 1986-05-17 富士通株式会社 音声標準パタン作成処理方法
JPS6199197A (ja) * 1984-10-02 1986-05-17 富士通株式会社 音声標準パタン作成処理方法
JPH0422520B2 (ja) * 1984-10-02 1992-04-17 Fujitsu Ltd
JPH0424718B2 (ja) * 1984-10-02 1992-04-27 Fujitsu Ltd
JPH04293097A (ja) * 1991-03-22 1992-10-16 Sharp Corp 話者識別装置

Similar Documents

Publication Publication Date Title
US20170358306A1 (en) Neural network-based voiceprint information extraction method and apparatus
Rabiner et al. A simplified, robust training procedure for speaker trained, isolated word recognition systems
JPS6184694A (ja) 認識用辞書学習方法
CN110310664A (zh) 设备降噪功能的测试方法及相关设备
JPS593491A (ja) 音声認識装置
JPS6361300A (ja) 音声認識方式
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
Daly Recognition of words from their spellings: Integration of multiple knowledge sources
JPS63188199A (ja) パタンマッチング装置
JPS6315295A (ja) 音声認識装置
JPS58105299A (ja) アルフアベツト音声認識装置
JPS60147797A (ja) 音声認識装置
JPS63303398A (ja) 音声認識装置
JPH0464076B2 (ja)
JPS63300298A (ja) 音声認識装置
JPS62113196A (ja) 音声認識学習方式
JPS59189398A (ja) 連続音声認識方式
JPS60198598A (ja) 音声認識方式
JPS60115993A (ja) 単音節音声認識装置
JPS59124388A (ja) 単語音声認識処理方式
JPS60202494A (ja) 単語音声認識方法
JPS6172300A (ja) パタ−ン照合方式
JPS63121099A (ja) 音声認識装置
JPS61147299A (ja) 音声認識装置
JPS63318600A (ja) 音声認識方式