JPS6060698A - 音声標準特徴パターン作成処理装置 - Google Patents

音声標準特徴パターン作成処理装置

Info

Publication number
JPS6060698A
JPS6060698A JP58168797A JP16879783A JPS6060698A JP S6060698 A JPS6060698 A JP S6060698A JP 58168797 A JP58168797 A JP 58168797A JP 16879783 A JP16879783 A JP 16879783A JP S6060698 A JPS6060698 A JP S6060698A
Authority
JP
Japan
Prior art keywords
voice
pattern
audio
input
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58168797A
Other languages
English (en)
Other versions
JPH0331275B2 (ja
Inventor
佐藤 泰雄
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58168797A priority Critical patent/JPS6060698A/ja
Publication of JPS6060698A publication Critical patent/JPS6060698A/ja
Publication of JPH0331275B2 publication Critical patent/JPH0331275B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 囚 発明の技術分野 本発明は音声標準特徴パターン作成処理方式。
クル゛に、未知入力音声から得られる入力特徴パターン
との照合に用いられる標準特徴パターンに関する登録音
声を、再生して使用者に聞かせるようにし、誤った発声
による標準特徴パターンを再登録できるようにした音声
標準特徴パターン作成処理方式に関するものである。
(Bl 従来技術と問題点 一般に音声認識において、認識率を向上させるためには
、音声情報からどのような特徴パラメータを抽出し照合
に用いるかが重要でちるが、そのシステムで定められた
0似抽出により、各項目を代表する標f!特徴バ2メー
タとして、いかに最適なものを辞書に用意するかについ
ても重要である。
特徴の抽出のし方や照合のし方が、いかに優れていても
、辞書中に登録される標準特徴パターンに。
雑音付加パターン、不明瞭発声パターン等の不良標準%
徴パターンや1例えばraJを登録すべきときに「i」
と発声してしまう等の発声誤りによる誤り標準特徴パタ
ーンが多ければ、認識率は向上しない。
標準特徴パターンは、辞1.中にディジタル情報で記憶
され、その数が多り1機械部品のように目にみえるわけ
ではなく、またすべての標ikj<特徴ハターンが一律
に使用されるわけではないので、一旦登録されてしまう
と、上記不良標準特徴パターン、誤り標準特徴パターン
等の検出は容易ではない0 従来、一旦登録した標準特徴パターンはすべて正しいも
のとして扱い、認識誤りが生じた場合。
認識させようとする入力音声が悪いか、またはl′Z識
の限界であって、止むを得ないものとされるのが一般的
であった。また、誤u i1&を生じさぜた入力音声か
ら抽出された入力特徴パターンと、既に登録されている
標準特徴パターンとのいわゆる平均化によシ、辞書の品
質を改良していく学習方式等も提案されているが、登録
済みの標準特徴パターンが、ある程度正しいという前提
のもとにとられる方式であって、標準特徴パターンが誤
っている場合には、収束が遅いという問題がちった。
登録しようとする標準特徴パターンま/こは既に登録さ
れている標準特徴パターンが適描なものではない場合、
それを検出して再登録できるようにすることが望まれる
ところで、従来、音声の認識結果を音声で出力する方式
は考えられていたが、認識結果として出力される音声の
情報は、各項目に対応して用意されているものであって
、各標緒特徴パターンに対応して用意されているもので
はなかった。そのため、誤認πλが生じた場合等に、出
力音声をIjrJいても、それによって標準特徴パター
ンの良否を決定することはできなかった。
(C1発明の目的と(;・1成 本発明は上記問題点の解決を図り、登録/練習モード時
もしくは認識モード時に、′fA在着目されている標準
特徴パターンのもとになった登録音声を再生して出力す
ることにより、使用者が誤った発声による登録であるこ
とを認知できるようにし。
妥当でない標準特徴パターンについてtよ、7+)登録
することにより、辞書の品質を向上させl I:gjt
ffit率を高めることを目的としている。そのため9
本発明の音声標準特徴パターン作成処理方式は、未知入
力音声を音響分析して得られる入力!1ヶ徴パターンと
、予め辞書中の各項目に対応して格納された標準特徴パ
ターンとの照合によって、8声IX 職を行う音声認識
システムにおいて、上記標準%%aパターンを上記辞書
中に登録するにあたって1Jttt:のだめに入力した
音声を再生して出力する音p3 Wf生部と、登録音声
発声誤りに関する指示を入力する登録音声誤り指示部と
、該登録音声誤り指示部からの指示にもとづいて当該登
録音声情へ・1)を棄却する登録棄却部とをそなえたこ
とを特徴としている。
さらに、もう1つの本発明は、未知入力ff声を音響分
析して得られる入力%徴パター:/と、予め辞書中の各
項目に対応して格納された標$ljr憧パターンとの照
合によって、音声認識を行う音P’J Pg識クシステ
ムおいて、上記辞書は上記標準% r;、<パターンに
対応して音声情報を記憶する音声情報記憶部をそなえ、
音声認識時または認識誤りが生じた際に上記辞Q中の該
当する上記音声情報にもとづいて音声を再生して出力す
る音声再生部と、使用者の指示により当該標準特徴パタ
ーンの登録を削除する登録削除部とをそなえたことを特
徴としている。以下図面を参照しつつ、実施例に従って
説明する。
(Di 発明の実施例 第1図は音声パターンの分布と標準特徴パターンとの間
係を説明するための図、第2図は本発明による処理概要
を説明するだめの図、第3図は本発明の一実施例(、゛
J城、力4図は第6図図示実施例における音声1チ生に
ついての説明図を示す。
第1図において、A、B、Cの実線で囲まれた部分は、
パターン空間における実際の音声パターンの分布を示し
、A1およびA2は単語A(単音節を含む。以下同称。
)に対する登録された標準特徴パターン、B1ないしB
3は単語Bに対する標準特徴パターン、C1は単語Cに
対する標準%微パターンを表わしている。図示Cのよう
に、1つの単語項目について、1つの標準特徴パターン
でカバーできる場合もあるが2通常2図示A、Hのよう
に。
1つの項目について複数の標準特徴パターンを用意し、
認識すべき音声パターンの分布屈曲をカバーするのが普
通である。例えば、未知入力■声の入力l特徴パターン
Xが抽出されると、その人力Its徴パターンXと各標
準特徴パターンA、11 A21131 +・・・・・
・とのマツチング距離の演3F、を行い、距離の小さい
標準特徴パターンの属する項目をPだ舵結里とする。
もし、辞書に登録された標準特徴で(ターンの中に、音
声パターンの分布から外れた不良性イ(へ1”ろ・微パ
ターンや誤り標準特徴パターン等が心れば、認識率は劣
化することとなる。本発明は、このような妥当でない標
準特徴パターンを登録前または登録後に削除することに
よって、認識率を向上さぜようとするものである。
例えは、第2図図示の如く、単語「衣谷」の音声パター
ンの分布が2図示Sであり1.甲飴[ト1比谷」の音声
パターンの分布が図示Hであったとする。辞1!l:の
作成にあたって、それぞれ復航側の標バヘ!1ン徴パタ
ーンを登録するとき、操作ミスまたは発声ミスによって
、「シプヤ」と発声すべきところを、誤って「ヒビャ」
と発声し、この標準特徴パターンS3を登録してしまっ
たとする。標準%微パターンS3は、実際には「ヒビャ
」の音声)(ターンであるにもかかわらず、辞書におい
ては単語「波谷」にが≦するものとして記憶されること
になる。
1兜、上記のように登録されてしまうと2例えば「シブ
ヤ」の発声に対する認識にあたっては。
標準特徴パターンS1およびB2だけがマツチングし。
パターンS3はマツチングしない。しかし、パターンS
、が誤っていることは、検知されず、単にパターンS、
に該当する発声がなされないとして扱われる。一方9例
えば第2図図示の如く、「ヒビャ」について入力性徴パ
ターンXの発声がなされたとする。入力特徴パターンX
と標準特徴パターンS3との距離d、は、標準特徴パタ
ーンH8との距離d2よシも小さいため、パターンXは
、単語「波谷」と認識されることとなる。この場合、従
来の学習方式等によれば、相準特徴パターンS3が誤っ
ているというよりも、むしろ、単語「日比谷」の4”ツ
〕′<へ特徴パターンH1,H2,H,が適当でないと
判断し。
「日比谷」に屑する標準特徴パターンの追加、イ1へ正
を行うようにされていた。そのため、誤り4.1% 3
T/!特徴パターンS3は、そのまま辞書中に放置され
ることとなる。
本発明の場合、第3図を参照して後述する如く。
まず第1に、標準特徴パターンを登録しようとして入力
した音声を、その場で再生して出力することにより、そ
の出力音声が登録を意図したものと同じでおるかどうか
を聞きわけることができるようにし、上記標準特徴パタ
ーンS3のような誤り標準特徴パターンの登録が、未然
に防止されるようにする。さらに他の本発明は、第5図
を参照して後述する如く1間違って上記誤り標準特徴パ
ターンS3が登録されてしまったとしても、その標準特
徴パターンSsが認識候補に用いられたとき、バタ−ン
S3に関する登fJ音声を再生して出力することにより
、該’!9’i Xへ!1ケ徴パターンS3が妥当なも
のでちるか否かを判断できるようにする。これによって
不良標バ゛口[ケ徴パターン等を検出し、辞書中から排
除できることとなる。
第6図は2本発明の一実施例栂成を示すブロック図でる
って1図中、符号1はマイクロホ/、2は音7jj、・
分析部、6はパターン抽出部、4は切替部。
5は音声再生部、6はスピーカ、7は入カイ々ターン・
バッファ、8はが択キー、9は誤り指示部。
10はパターン追加部、11は登録梨却部、12は辞書
、16は照合判定部を表わす。
マイクロホン1から入力された音声信号は、音f;2戸
分析部2において周波数分析される。音響分析部2は9
例えば帯域フィルタ群、パラメータ抽出回路等を有して
おり、入力音声の特信景(パラメータ)5例えば第1ホ
ルマント周波θに相当するモーメントM1や、第2ホル
マント周波数に相当するモーメントM2や、さらには、
低域電力や高域電力などを抽出し、これらの4′¥微量
に関するサンプル点を決定して、@微量の時系列情報を
得る。
音響分析部2において得られたノ(ラメータ時系列情報
は、パターン抽出部6に入力される。)ぐターン抽出部
3は、このパラメータ時系列情報から。
入力音声の特徴を表わす入力4守徴ノ(ターンを抽出す
る。切替部4は、パターン情報の登録または照合を1例
えばキーボード(図示省略)からのモード切替指示によ
り、切り替えるものでるる。
登録モードが指示されている場合、上記入力1r+f歓
パターンは、入カバターン・ノ(ツファ7に保持される
。音声再生部5は、登録のだめの入力音声を、音声合成
等により再生して、スピーカ6から出力する。これによ
って9例えば「シブヤ」と発声すべきところ、誤って「
ヒビャ」と発声した場合に、登録前にその発声を耳で確
認できるため。
誤りを検知できる。選択キー8は、登録するかしないか
を選択するためのキーである。旧り指示部9は、登録の
場合には、パターン追加部10を起動し2発声誤りのた
め、登録しない場合に(よ、登録棄却部11を起動する
。パターン追加部10は。
入カバターン・バッファ7に格納された入力09パター
ンを、標準特徴〕くターンとして、辞書12へ追加登録
する。登録棄却部11は、入カッ(ターン・バッファ7
上の入力特徴)くターンを棄却し。
再発声入力を促す。照合判定部16は、認識モード時に
、入力特徴パターンと、辞書中の標準特徴パターンとを
照合し、認識結果を出力するものでちる。
なお、第3図において、ノ(ターン追加部10は。
無条件にパターンの追加登録を行い、後に誤シ指示部9
からの指示により、登録棄却部11がその登録を抹消す
るようにしてもよい。
音声再生部5は9例えば第4図図示の如くにして、入力
if ?をM生して、スピーカ6に出力することができ
る。第4図(イ)図示の場合、登録音声を音81蓼分析
して得られた%徴ノくラメータ時系列をもとに、音声合
成することにより、音声を出力している。なお、この音
声合成は9周知の技術により実現できるので、ここでは
この程度の説明にとどめる。
第4図(ロ)図示の場合、登録音声をアナログ/デジタ
ル変換したディジタル音声を、そのit音声バッファに
蓄え、音声再生部において、ディジタル/アナログ変換
を行って出力する。第4図(ハ)図示の場合、登録音声
をアナログ・デジタル変Jfi したディジタル音声を
、音声符号化して+TJ’7”バッファに保持し、それ
を復号してディジタル/アナログ変換することにより、
音声を0生している。
第5図は他の本発明の一実施例措成、第6図は第5図図
示実施例の音声再生方式説明図を示す。
図中、符号1ないし6,12.13は第3図に対応し、
20はパターン争音声登録部、21は誤認識指示キー、
22は登録削除指示キー、23は誤認識指示部、24は
登録削除部、25は* 7’情報記憶部を表わす。
第6図図示実施例の発明では、登録時にイi、録音声を
再生して出力するが、第5図図示実施例の場合、認識時
に常時または認識誤りが生じた1ケに。
選択された標準特徴、パターンに関する登り音7+7を
再生して出力する。従って、登録後にも、111リイγ
準特徴パターンの検出および再登録が可能である。
音ツ、ン分析部2.パターン抽出部3.切替部4は。
第3図で説明したものと同様である。パターン・音声登
録部20は、登録モード時に、登録背戸の入力特徴パタ
ーンとともに、第6図を参照して後述する音声情報を、
辞−?!!: 12中の音声情報記憶部25へ、標準特
徴パターンに対応させて登録する。
認i+ii2モード時、照合判定部13は、入力特徴パ
ターンと各標準特徴パターンとの距pHを演算し。
照合を行う。そして、距tlの小さなものを認識結果と
して出力する。使用者は、認識結果が誤っている」ん合
に、誤認識指示キー21を押下する。誤認a1に指示部
23は、誤認耀指示キー21の押下を検出して)aUN
tλ誤りを辞書12の処理部または音声再生部5へ迫知
する。音声再生部5は、認識候補第1位または所定の範
囲内もしくは使用者の要求範囲内のtλ準特徴パターン
に対応する音声情報を、音声情報記・は部25から読出
し、音声を再生してスピーカ6から出力する。
一般に誤認識が生じる原因として、未知入力音声が不明
瞭でちる場合と、標準特徴パターンが適尚でない場合と
がある。本発明の場合、音r;41生部5による音声出
力によつ゛C2認識時に選択された標準特徴パターンの
妥当性がチェック可能となる。もし、標準特徴パターン
が妥当なものでない場合、使用者は、登録削除指示キー
22を押下する。この押下によって、登録削除部24は
、辞デ112中の当該標準特徴パターンおよびその音声
情報を削除する。そして、必要であれば、登録モードに
切替えて、正しい標準%徴パターンを71)登f?する
。なお、音声再生部5は、上述の如く、認識誤シが生じ
たときだけ、音声を再生して出力してもよいし、また、
照合判定部13が認識結果を出力する際、その結果に従
って、認識誤りの有無にかかわらず音声を出力するよう
にしてもよい。
次に、第6図を参照して、音声再生の処理について説明
する。例えば第6図(イ)図示の如く、旦り51時に、
登録音声を音t・分析して得られた’VFj徴パラメー
タ時系列を、辞書12に記憶する。音声f)生部5は、
その特徴パラメータ時系列を読出して。
音声を合成し、スピーカ6へ出方する。また、第61y
I(ロ)図示の如く、登録音声をアナ四グ/ディジタル
変換したディジタル音声を、そのままの形で辞窃12へ
格納しておき、認識時に読出して、ディジタル/アナロ
グ変換を行い、音声を再生してもよい。さらに第6図(
ハ)図示の如く、辞書12の記憶領域を削減するため、
登録音声をアナログ/ディジタル変挨後に音声符号化し
、その符号化情報を辞書12へ記憶し、認識時に俵号し
て音声を1゛)生じ出力するようにしてもよい。
fil 発明の効果 以上説すjした如く9本発明によれば、雑音付加パター
ン、不明瞭発声パターン等の不良特徴パターンや、誤り
発声にょるーシ標準特徴パターンの登録防止もしくは登
録削除が容易にできるようになり、経書の品質を向上さ
せて、認識率を良好にすることが可能となる。
4、 図面の?ざj単な説明 第1図は音声パターンの分布と標準特徴パターンとの関
係を説明するための図、第2図は本発明による処理概要
を説明するための図、第6図は本発明の一実施例措成、
第4図は第3図図示実施例における音声再生についての
説明図、第5図は他の本発明の一実施例購成、第6図は
第5図図示実施例の音声再生方式説明図を示す。
図中、3はパターン抽出部、5は音声再生部。
9は誤り指示部、11は登録棄却部、12はF′fWt
+13は照合判定部、23は誤認識指示部、24tよ登
録削除部、25は音声情報記憶部を表わす。
特許出願人 富士通株式会社

Claims (4)

    【特許請求の範囲】
  1. (1) 未知入力音声を音0分析して得られる入力4’
    W Qパターンと、予め辞谷中の各項目に対応して格納
    された標準特徴パターンとの照合によって。 音声認t1λを行う音声認識システムにおいて、上記(
    、y+ j、;’l 1f4j徴パターンを上記辞t9
    ・中に登録するにあたって、登録のために入力した音声
    を再生して出力する音声再生部と、登録音声発声誤りに
    関する指示を入力する登録音声誤り指示部と、該登録音
    声誤り指示部からの指示にもとづいて当該登録音声(j
    ’?報を原動する登録棄却部とをそなえたことを特徴と
    する音声標4!特徴パターン作成処理方式。
  2. (2) 上記音声再生部は、上記入力音声の再生にあた
    って、該入力音声を音谷分析して得られた特徴パラメー
    タ時系列を用いて音声合成することを特徴とする特許請
    求の範囲第(1)項記載の音声停準特徴パターン作成処
    理方式。
  3. (3) 未知入力音声を音響分析して得られる入力特徴
    パターンと、予め辞書中の各項目に対応して格納された
    標準特徴パターンとの照合によつで。 音声認識を行う音声認識システムにおいて、上記辞書は
    上記標準特徴パターンに対応して音声情報を記憶する音
    声情報記憶部をそなえ、音声認識時または認識誤りが生
    じた際に上記辞書中の該当する上記音声情報にもとづい
    て音声を杓生じで出力する音声再生部と、使用者の指示
    により当該標準@徴パターンの登録を削除する登録削除
    部とをそなえたことを0徴とする音声標準特徴パターン
    作成処理方式。
  4. (4)上記辞書に記憶される音声情報は、登(−六へ声
    から抽出した特徴パラメータ時系列、または登録音声を
    A/D変換したディジタル情報もしくはその音声符号化
    情報でおることを特徴とする11°イn’F請求の範囲
    第(3)項記載の音声標準特徴パターン作成処理方式。
JP58168797A 1983-09-13 1983-09-13 音声標準特徴パターン作成処理装置 Granted JPS6060698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58168797A JPS6060698A (ja) 1983-09-13 1983-09-13 音声標準特徴パターン作成処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58168797A JPS6060698A (ja) 1983-09-13 1983-09-13 音声標準特徴パターン作成処理装置

Publications (2)

Publication Number Publication Date
JPS6060698A true JPS6060698A (ja) 1985-04-08
JPH0331275B2 JPH0331275B2 (ja) 1991-05-02

Family

ID=15874649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58168797A Granted JPS6060698A (ja) 1983-09-13 1983-09-13 音声標準特徴パターン作成処理装置

Country Status (1)

Country Link
JP (1) JPS6060698A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60185999A (ja) * 1984-03-05 1985-09-21 シャープ株式会社 日本語音声入力装置
JPS6326699A (ja) * 1986-04-25 1988-02-04 テキサス インスツルメンツ インコ−ポレイテツド 連続語認識記録方法
JPS63292196A (ja) * 1987-05-26 1988-11-29 日本電気株式会社 特定話者用音声認識装置
JPS63305396A (ja) * 1987-06-05 1988-12-13 ソニー株式会社 音声認識装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system
JPS57191698A (en) * 1981-05-21 1982-11-25 Hitachi Ltd Voice recognition system
JPS5816296A (ja) * 1981-07-23 1983-01-29 株式会社日立製作所 音声認識方式
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS593491A (ja) * 1982-06-29 1984-01-10 富士通株式会社 音声認識装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system
JPS57191698A (en) * 1981-05-21 1982-11-25 Hitachi Ltd Voice recognition system
JPS5816296A (ja) * 1981-07-23 1983-01-29 株式会社日立製作所 音声認識方式
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS593491A (ja) * 1982-06-29 1984-01-10 富士通株式会社 音声認識装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60185999A (ja) * 1984-03-05 1985-09-21 シャープ株式会社 日本語音声入力装置
JPH0229231B2 (ja) * 1984-03-05 1990-06-28 Denshi Keisanki Kippon Gijutsu
JPS6326699A (ja) * 1986-04-25 1988-02-04 テキサス インスツルメンツ インコ−ポレイテツド 連続語認識記録方法
JPS63292196A (ja) * 1987-05-26 1988-11-29 日本電気株式会社 特定話者用音声認識装置
JPS63305396A (ja) * 1987-06-05 1988-12-13 ソニー株式会社 音声認識装置

Also Published As

Publication number Publication date
JPH0331275B2 (ja) 1991-05-02

Similar Documents

Publication Publication Date Title
White et al. Speech recognition experiments with linear predication, bandpass filtering, and dynamic programming
Taylor Analysis and synthesis of intonation using the tilt model
US6161091A (en) Speech recognition-synthesis based encoding/decoding method, and speech encoding/decoding system
JPH03501657A (ja) パターン認識エラー低減装置
JPS58130393A (ja) 音声認識装置
Reddy et al. The Hearsay-I speech understanding system: An example of the recognition process
JPS6060698A (ja) 音声標準特徴パターン作成処理装置
JPS6348598A (ja) 単語音声認識装置
CN114203160A (zh) 应样本数据集生成方法、装置及设备
CA2191377A1 (en) A time-varying feature space preprocessing procedure for telephone based speech recognition
JPH03147052A (ja) 音声日本語入力方式
JPS63269200A (ja) 音声認識装置
JPS6060697A (ja) 音声標準特徴パタ−ン作成処理方式
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPS613241A (ja) 音声確認方式
JP2655637B2 (ja) 音声パターン照合方式
JPS6352200A (ja) 音声認識装置
JPS6059395A (ja) 音声標準特徴パタ−ン作成処理方式
JPS6295595A (ja) 音声応答方式
JPS59176782A (ja) デジタル音響装置
JP2000148189A (ja) 音声処理装置
JPS59146100A (ja) 音声登録方式
JPS58129453A (ja) 外国語学習装置
JPH075799A (ja) 音声情報処理装置
JPS616694A (ja) 音声登録方式