JPS61258299A - 特定話者用単語音声認識装置 - Google Patents

特定話者用単語音声認識装置

Info

Publication number
JPS61258299A
JPS61258299A JP60100899A JP10089985A JPS61258299A JP S61258299 A JPS61258299 A JP S61258299A JP 60100899 A JP60100899 A JP 60100899A JP 10089985 A JP10089985 A JP 10089985A JP S61258299 A JPS61258299 A JP S61258299A
Authority
JP
Japan
Prior art keywords
word
uttered
dictionary
length
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60100899A
Other languages
English (en)
Inventor
河本 俊毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60100899A priority Critical patent/JPS61258299A/ja
Publication of JPS61258299A publication Critical patent/JPS61258299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 挟亙分更 本発明は、特定話者用音声認識装置に関する。
丈米1宜 特定話者用音声認識装置の音声辞書登録において、−単
語を何回か発声して重ねあわせた辞書を作成する場合、
違う単語を発声したり、環境騒音が登録時に混入したり
して、正確な辞書が作成されず、認識率に悪影響をおよ
ぼすことがあった。
且−一五 本発明は、上述のごとき実情に鑑みてなされたもので、
発声単語を何回か重ねあわせて辞書を作成する特定話者
用単語音声認識装置において、正確な辞書作成を行うこ
とを目的としてなされたものである。
(−一」又 本発明は、上記目的を達成するため、発声単語を何回か
重ねあわせて辞書を作成する特定話者用単語音声認識装
置において、音声辞書作成時に2回目以降の発声時には
その発声単語長と1回目の発声単語長とを比較し、その
比較結果がある範囲外の値である時にリジェクトする機
能を有すること、或いは、辞書作成時に1回目と2回目
の発声単語長の平均を求め、その平均値と、3回目以降
の発声単語長とを発声時に比較し、その比較結果がある
範囲外の値である時に、リジェクトする機能を有するこ
と、或いは、辞書作成時に、発声単語長がある範囲外の
値であればリジェクトし、かつ、その範囲より小さいの
か大きいのかを話者に教える機能を有すること、或いは
、辞書作成時に。
1回目、2回目発声単語の無音区間数と発声長の平均と
を記憶し、3回目発声時に無音区間数2発声長を1,2
回目のものと比較し、無音区間数が等しくないもの、発
声長の平均とかけ離れたものに関してはリジェクトする
機能を有することを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
第1図は、本発明による特定話者用単語音声認識装置の
一実施例を説明するための電気°的ブロック線図で、図
中、1はマイク、2は前処理部、3は例えば15チヤン
ネルのバンドパスフィルタ(B、P、F)群]4は特徴
抽出部、5は辞書登録部、6は認識処理部、7は結果出
力部で、上記音声認識装置を用いて、−単語を何回か発
声してそれを重ねあわせて、特定話者用音声認識装置用
の辞書を作成する音声辞書登録時に、1回目発声の単語
長を、音声データと同じく記憶させておく。
2回目発声時に2回目発声単語の単語長と前述のごとく
して記憶した1回目の単語長との比X、を計算する。
第2図は、その様子を示す図で、(a)図は1回目の発
声単語長f1.(b)図は2回目の発声単語長f2を表
わし、X工=ft/f2である。
ここで、同じ単語を続けて発声した場合には、その長さ
は極端に変化することはないから、この比X、はある範
囲内のa > Xi > bに入る。2回目の発声で違
う単語を入力したり、環境騒音が付加したりした場合に
は、その単語長が長くなったり、短くなったりして、1
回目の単語長と2回目の単語長との比x1がxl(0又
はb (x 1 となる。
そこで、正確な音声辞書作成の為、この比x1がXi<
Q又はb (x 1 となった場合には、2回目の発声
単語をリジェクトして、辞書に登録しない様にする。
上記音声辞書登録時に、1回目発声の単語に環境騒音が
付加して、長くなった様な場合には、2回目以降正確に
登録しても、リジェクトされてしまうことになる。これ
を防ぐ為、まず、1回目発声時に発声単語長を記憶して
おき、2回目発声時にこの発声単語長と1回目の発声単
語長との平均を計算して、これを記憶する。3回目に発
声した単語長と平均単語長との比x2を計算して、この
値がある範囲外、X2<。又はb (x 2となる場合
には、3回目の発声単語をリジェクトとする。
次に、3回目の発声がリジェクトされなかった場合には
、この発声単語長と平均発声長との平均をとり、これを
新たな平均発声単語長とする。以下、同様な手順でくり
返せば、平均的な辞書が出きる。
第3図は、その様子を示す図で、(a)図は1回目の発
声単語長f1、(b)図は2回目の発声単語長f2、(
c)図は3回目の発声単語長f3f、 + f2 を表わし、この場合、x2=□である。
上記第2図及び第3図に関して説明した方法では、より
正確な辞書が作成されるかもしれないが、1回目発声が
不正確だった場合、これが辞書に残されてしまう、これ
を防ぐ為、発声時に発声単語長と音声パワーが途切れた
状態になる無音区間がその発声の中にいくつあったカー
とし)う無音区間情報を記憶させる。2回目発声時しこ
も同様しこ無音区間の数と、発声単語長を記憶する。3
回目発声日寺ニハ、無音区間の数を検出してこれを1回
目、2回目のものと比較する。1回目、2回目のどちら
かの無音区間の数が3回目のものと違ってtまたら1.
2回目の違っている方のデータを捨て、1ノジエクトの
信号を出す、3回とも同じなら4f、比重こ発声単語長
を調べる。第3図の場合と同様しこ1゜2回目の平均発
声単語長と3回目の発声単語長さの比x3を計算し、あ
る範囲内Oくx3くbしこ納まらないならば、リジェク
トする。以下同様側こして辞書を作成する。
第4図は、その様子を示す図で、(a)図は1回目の発
生単語長f、、(b)図は2回目の発生で、前記同様、
x2 =□である。また、図中の斜線部は無音区間を示
し−m1は1回目の発声単語長f、内における無音区間
数、m2は2回目の発声単語長f2内における無音区間
数、m3は3回目の発声単語長f3内における無音区間
数で、前述のように、例えば、3回目の単語発生時に、
m3とml、及び、m3とm2を比較する。
更に、上述のごとくして音声を登録する場合、音声登録
時にリジェクトされた発声単語が平均よりも長かったの
か短かったのかがわかれば5次に発声する際、発声者は
発声し易い。第5図は、このような要望に応えてなされ
た音声認識装置の一例を示す電気的ブロック線図で、図
中、8はリジェクト表示部で、前述のごとくして発声1
11.語がリジェクトされた時に、長かったか短かった
かを平均発声長との比で判断し、表示器8で表示する様
にしたものである。
文−一一果 以上の説明から明らかなように、本発明によると、特定
話者用音声認識装置の辞書登録時に、誤った音声情報を
登録することがなくなり、認識率に悪影響をおよぼさず
、精度のよい特定話者用音声認識装置を提供することが
できる。
【図面の簡単な説明】
第1図は、本発明による音声認識装置の一実施例を説明
するための電気的ブロック線図、第2図乃至第4図は、
それぞれ本発明の詳細な説明するための図、第5図は1
本発明の他の実施例を説明するための電気的ブロック線
図である。 1・・・マイク、2・・・前処理部、3・・・B、P、
F群。 4・・・特徴抽出部、5・・・辞書登録部、6・・・認
識処理部、7・・・結果出力部、8・・・リジェクト表
示部。 第  1  図 i2図 県3図

Claims (4)

    【特許請求の範囲】
  1. (1)、発声単語を何回か重ねあわせて辞書を作成する
    特定話者用単語音声認識装置において、音声辞書作成時
    に2回目以降の発声時にはその発声単語長と1回目の発
    声単語長とを比較し、その比較結果がある範囲外の値で
    ある時にリジェクトする機能を有することを特徴とする
    特定話者用単語音声認識装置。
  2. (2)、発声単語を何回か重ねあわせて辞書を作成する
    特定話者用単語音声認識装置において、辞書作成時に1
    回目と2回目の発声単語長の平均を求め、その平均値と
    、3回目以降の発声単語長とを発声時に比較し、その比
    較結果がある範囲外の値である時に、リジェクトする機
    能を有することを特徴とする特定話者用単語音声認識装
    置。
  3. (3)、発声単語を何回か重ねあわせて辞書を作成する
    特定話者用単語音声認識装置において、辞書作成時に、
    発声単語長がある範囲外の値であればリジェクトし、か
    つ、その範囲より小さいのか大きいのかを話者に教える
    機能を有することを特徴とする特定話者用単語音声認識
    装置。
  4. (4)、発声単語を何回か重ねあわせて辞書を作成する
    特定話者用単語音声認識装置において、辞書作成時に、
    1回目、2回目発声単語の無音区間数と発声長の平均と
    を記憶し、3回目発声時に無音区間数、発声長を1、2
    回目のものと比較し、無音区間数が等しくないもの、発
    声長の平均とかけ離れたものに関してはリジェクトする
    機能を有することを特徴とする特定用単語音声認識装置
JP60100899A 1985-05-13 1985-05-13 特定話者用単語音声認識装置 Pending JPS61258299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60100899A JPS61258299A (ja) 1985-05-13 1985-05-13 特定話者用単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60100899A JPS61258299A (ja) 1985-05-13 1985-05-13 特定話者用単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS61258299A true JPS61258299A (ja) 1986-11-15

Family

ID=14286187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60100899A Pending JPS61258299A (ja) 1985-05-13 1985-05-13 特定話者用単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS61258299A (ja)

Similar Documents

Publication Publication Date Title
JPS61258299A (ja) 特定話者用単語音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH02210500A (ja) 標準パターン登録方式
JPH04369698A (ja) 音声認識方式
JP2658104B2 (ja) 音声認識装置
JPS6064396A (ja) 音声認識装置
JPS60121499A (ja) 音声照合装置
JPH0567039B2 (ja)
JP2901976B2 (ja) パターン照合予備選択方式
JPS60175098A (ja) 音声認識装置
JPS6217760B2 (ja)
JPS60100197A (ja) 音声入力装置
Lienard Speech characterization from a rough spectral analysis
JPS6076798A (ja) 音声認識装置
JP2768938B2 (ja) パターン比較方法
JPS6242200A (ja) 音声認識装置
JPS6064397A (ja) 音声認識装置
JPH06100918B2 (ja) 音声認識装置
JPS60125899A (ja) 音声認識装置
JPS62245295A (ja) 特定話者音声認識装置
JPH0316038B2 (ja)
JPS6173998A (ja) 音声認識装置
JPS6258517B2 (ja)
JPS59219798A (ja) 音声認識装置
JPS6151196A (ja) 音声認識装置