JPS6059395A - 音声標準特徴パタ−ン作成処理方式 - Google Patents

音声標準特徴パタ−ン作成処理方式

Info

Publication number
JPS6059395A
JPS6059395A JP58167986A JP16798683A JPS6059395A JP S6059395 A JPS6059395 A JP S6059395A JP 58167986 A JP58167986 A JP 58167986A JP 16798683 A JP16798683 A JP 16798683A JP S6059395 A JPS6059395 A JP S6059395A
Authority
JP
Japan
Prior art keywords
standard feature
dictionary
patterns
item
feature pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58167986A
Other languages
English (en)
Inventor
教幸 藤本
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58167986A priority Critical patent/JPS6059395A/ja
Publication of JPS6059395A publication Critical patent/JPS6059395A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ■発明の技術分野 本発明は音声標準特徴・ξターン作成処理方式。
特に音声紹1iflシステムにおける辞書の作成にあた
って、互いに距離の近い辞書項目の標準特徴パターンの
登録を避けることによシ、辞書に用意される項目を代表
する標準特徴パターンの質を良好にし、認識率を向上さ
せるようにした音声標準特徴パターン作成処理方式に関
するものである。
ω)従来技術と問題点 一般に音声認識において、認識率を向上させるためには
、音声情報からどのような特徴・ぞラメータを抽出し照
合に用いるかが重要であるが、そのシステムで定められ
た特徴抽出によシ、各項目を代表する標準特徴パラメー
タとして、いかに最適なものを辞荀に用意するかについ
ても重要である。
特徴の抽出のし方や照合のし方が、いかに優れていても
、辞書中に登録される標準特徴パターンに。
雑音付加パターン、不明瞭発声ノミターン等の不良標準
特徴ノミターンや1例えば「α」を登録すべきときに「
L」と発声してしまう等の発声膜シによる誤り標準!1
を徴パターンが多ければ、認識率は向上しない。また、
相異なる辞書項目をそれぞれ代表する標準特徴パターン
の距離が、極めて近い場合にも、その辞書項目について
の誤認識が生じやすく、認識率を低下させる原因となる
従来、認識誤シが生じた場合、認識させようとする入力
音声が悪いか、または認識の限界であって、止む得ない
ものとされるのが一般的であった。
また、誤認識を生じさせl(入力音声から抽出された入
力特徴パターンと、既に登録されている標準特徴・々タ
ーンとのいわゆる平均化により、辞書の品質を改良して
いく学習方式等も提案されているが、登録(埒みの標準
特徴パターンが、ある程度圧しいという前提のもとにと
られる方式であって。
標準特徴パターンが誤っている場合には、収束が遅いと
いう問題があった。特に、各辞書項目については、少な
くとも1つの代表する標準特徴パターンが、最初に登録
されるが、これらの標準特徴パターンは、相互にある程
度の距離を有していることが望まれる。異なる辞書項目
についての標準特徴パターンの距離が、小さくなる原因
としては。
辞書項目の音韻が極めて類似している場合だけでなく2
発声誤υによる場合や、不明瞭な発声または雑音等によ
シ、音声に含まれる周波数成分が類似してくることなど
が考えられる。
0発明の目的と構成 本発明は上記問題点の解決を図り、各辞書項目について
、互いに距離の近い標準特徴パターンをできるだけ作ら
ないようにし1品質のよい辞1′を作成して、認識率を
向上させることを目的としている。そのため1本発明の
音声標準特徴パターン作成処理方式は、未知入力音声を
音響分析して得られる入力特徴パターンと、予め辞書中
の各項目に対応して格納された標準特徴パターンとの照
合によって音声認識を行う音声認識システムにおいて、
標準特徴パターンを各辞書項目に対し−C1パターン宛
の登録をした後、上記各標準特徴パターンの相互の距離
を演算する距離計算部と、該距離計算部によ請求めた上
記各標準特徴パターン相互の頷似度が所定の閾値より大
きいか否かを判定する判定部とをそなえ、該判定部の判
定結果に従って、相頷似する標準特徴パターンの項目対
についての登録音声を再入力し、再登録することを特徴
としている。以下図面を参照しつつ説明する。
(2)発明の実施(911 第1図は音声パターンの分布と標準特徴パターンとの関
係を説明するだめの図、第2図は本発明による処理概要
を説明するだめの図、第3図は本発明の一実施例構成を
示ヤ。
第1図において、A、B、Cの実線で囲まれた部分は、
パターン空間における実際の音声パターンの分布を示し
、 AlおよびA2は単語A(単音節を含む。以下同様
。)に対する登録された標準特徴パターン+ Blない
しB3は単語Bに対する標準特徴パターン、 C1は単
語Cに対する標準特徴パターンを表わしている。図示C
のように、1つの羊語項目について、1つの標準特徴パ
ターンでカバーする”Bl合もあるが2例えば1図示A
、Bのように、1つの項目について複数の標準特徴パタ
ーンを用意し、認識すべき音声、aターンの分布範囲を
カバーする場合もある。例えば、未知人力t(声の入力
特徴パターンXが油出されると、その入力特徴パターン
Xと各標準特徴・樗ターンAll All Bll・・
・とのマツチング距離の演算を行い、距離の小さい標準
特徴パターンの属する項目を認識結果とする。
以上のような標準特徴パターンによる音声認識を行うシ
ステムにおいて9本発明は、特に標準特徴パターンを各
辞書項目に対して、1・ぐターン宛の登録をする場合の
処理態様に関連している。以下第2図を参照して説明す
る。
例えば、辞看8項目rAJ、rBJ、rCJ。
rDJ・・・についての、1つの標準特徴)ξターンが
それぞれ第2図(イ)図示の如< 、 Al、 431
. cl、 DI・・・であったとする。1・々ターン
宛の登録後に、各標準特徴パターン相互の距離を演算す
る。そして。
この距離が、標準特徴パターンの属する辞書項目対に対
して予め定められた閾値よシも大きいか否かを判定する
。第2図(イ)の場合1例え、ば標準ノ特徴パターンA
IとB1との距離dABが9項目対人。
Bについて定められた閾値tよりも小さい。この場合、
 i’7%M1.t’jl”l r A J ト「B 
J トにツイテ、 誤認識が生じやすくなると考えられ
る。従って2本発明では、辞7丁項目rAJおよびrB
Jについて。
再度発声を促し、標準特徴パターンAI、Blの再登録
を行う。 ゛ 1i”l”ilF項目rAJおよびrB−、Jの再発声
から得られた!特徴パターンが2例えば第2図(ロ)図
示A I’およびB l’であったとする。この場合に
、特徴・ξターンA l 、B ]、、A 1’、B−
1’の距離の関係が1例えば であれば、辞書二項目rAJおよび「B」についてc+
 欅:qs を特徴)Z ター 7としテ、AI’とB
l’、−1,たはA 1’ と131 とが選ばれるこ
とになる。なお、上記閾値tは、システム全体で一律に
定めてもよいが、各#艮項目の音韻の類似性に着目して
、予め各辞書部[」対ごとに適当に定めておくことが望
ましい。
第5図は1本発明の一実施例構成を示すブロック図であ
る。図中、lはマイクロホン、2は音響分析部、3はパ
ターン抽出部、4は切替部、5は・ぞターン登録部、6
は辞書部、7は距離計算部。
8は判定部、9は表示部、10は照合判定部を表わす。
マイクロホン1から入力さ−れた音声信号は、音響分析
部2において周波数分析される。音響分析部2は2例え
ば帯域フィルタ群、パラメータ抽出回路等を有しており
、入力音声の特徴段(パラメータ)1例えば第1ホルマ
ント周波数に相当するモーメン) Mlや、第2ホルマ
ント周波数に相当するモーメン)f〜12や、さらには
、低域電力や高域電力などを抽出し、これらの特徴量に
関するサンプル点を決定して、特徴量の時系列情報を得
る。
音g分析部2において得られた・ξラメータ時系列情報
は、パターン抽出部3に入力される。パターン抽出部3
は、このパラメータ時系列・情報から。
入力音声の一特徴を表わす入力!特徴パターンを抽出す
る。切替部4は、パターン情報の登録または照合を1例
えばキーボード(図示省略)からのモード切替指示によ
シ、切シ替えるものである。・ξターン登録部5は、登
録指示があった場合に、ノソターン抽出部3が抽出した
入力特徴パターンを、その項目名に対応させて、辞書部
6に追加登録するものである。辞岩部6は、−fllえ
ば磁気ディスク装置等の外部記憶装置でおって、認識対
象の項目名と標準!1+f徴パターンの情報とを記憶し
て保持する。
距離計算部7は、パターン登録部5が標準特徴パターン
を各辞朋・項目に対してlパターン宛の登録をしたとき
に起動され、各標弗特徴パターン間の距離全演算する。
距離計算部7による演算結果は、各辞書項目対ごとに1
判定部8へ引き渡される。判定部8は、その距離を所定
の閾値と比較し、μ準特徴パターンの距離が近過ぎない
かどうかを判定する。2つの標準特徴パターンが、ある
値以上、離れている場合には、同様に他の辞書項目対に
ついて処理を繰シ返す。
判定部8による判定の結果、2つの標準特徴ノぐターン
の距離が、閾値よシも小さい場合には、その辞書項目対
の項目名を表示部9へ通知する。表示部9は通知された
2つの項目名を例えばCRTディスプレイに表示し、そ
れらの項目名の登録音声について、再入力を促す。こう
して2例えば第2図によって説明したように、類似度が
大き過ぎる項目対については、すべて再登録が行われる
こととなる。
認識を行う場合、パターン抽出部3の出力は。
照合判定部10に供給される。照合判定部1oは。
辞書部6の内容を順次読出し、入力特徴パターンと辞書
に登録されている標準特徴ノぞターンとを。
例えば周知のダイナミック・プログラミング(DP )
マツチング等によシ照合する。本発明の場合、標準特徴
パターン間の距離が極端に小さいものは。
再登録されているだめ、音声パターンの分布が。
よシ均−化され、従って、認識率が向上することとなる
■発明の詳細 な説明した如く本発明によれば、各辞書項目を代表する
検車特徴パターン間の距離が極端に小さいものがなくな
るので、認識率が向上し、また登録時における発声部シ
により2間違って他の項目名で発声して「た録してしま
った場合に、その標準特徴パターンは、当該他の項目名
の標準特徴パターンと類似するので再登録の対象となシ
、誤シ登録が修正されるこ−ととなる。
【図面の簡単な説明】
第1図は音声パターンの分布と標準特徴パターンとの関
係を説明するだめの図、第2図は本発明による処理概要
を説明するだめの図、第3図は本発明の一実施例構成を
示す。 図中、3はパターン抽出部、5はパターン登録部、6は
辞書部、7は距離計算部、8は判定部。 9は表示部、10は照合判定部を表わす。 特許出願人 富士通株式会社 代即人弁理士 森 1) 寛(外1名)第 1 (2) 第2 図 dAB≦! (ロ)461 盆唯 稼; 口

Claims (1)

    【特許請求の範囲】
  1. 未知入力音声を音響分析して得られる入力特徴パターン
    と、予め辞書中の各項目に対応して格納された標準特徴
    /々ターンとの照合によって音声認識を行う音声認識シ
    ステムにおいて、標準特徴パターンを各辞書項目に対し
    てlパターン宛の登録をした後、上記各標準特徴・々タ
    ーンの相互の距離を演箕する距離計算部と、該距離計算
    部によ請求めた上記各標準特徴パターン相互の類似度が
    所定の閾値より大きいか否かを判定する判定部とをそな
    え、該判定部の判定結果に従って、相類似する標準特徴
    パターンの項目対についての登録音声を再入力し、再登
    録することを特徴とする音声標準特徴パターン作成処理
    方式。
JP58167986A 1983-09-12 1983-09-12 音声標準特徴パタ−ン作成処理方式 Pending JPS6059395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167986A JPS6059395A (ja) 1983-09-12 1983-09-12 音声標準特徴パタ−ン作成処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167986A JPS6059395A (ja) 1983-09-12 1983-09-12 音声標準特徴パタ−ン作成処理方式

Publications (1)

Publication Number Publication Date
JPS6059395A true JPS6059395A (ja) 1985-04-05

Family

ID=15859680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167986A Pending JPS6059395A (ja) 1983-09-12 1983-09-12 音声標準特徴パタ−ン作成処理方式

Country Status (1)

Country Link
JP (1) JPS6059395A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62148998A (ja) * 1985-12-23 1987-07-02 松下電器産業株式会社 音声認識装置
JPS62287298A (ja) * 1986-06-06 1987-12-14 株式会社日立製作所 音声認識装置
JPS6338994A (ja) * 1986-08-04 1988-02-19 松下電器産業株式会社 音声認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57141700A (en) * 1981-02-26 1982-09-02 Mitsubishi Electric Corp Voice recognizer
JPS59154500A (ja) * 1983-02-21 1984-09-03 松下電器産業株式会社 音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57141700A (en) * 1981-02-26 1982-09-02 Mitsubishi Electric Corp Voice recognizer
JPS59154500A (ja) * 1983-02-21 1984-09-03 松下電器産業株式会社 音声認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62148998A (ja) * 1985-12-23 1987-07-02 松下電器産業株式会社 音声認識装置
JPS62287298A (ja) * 1986-06-06 1987-12-14 株式会社日立製作所 音声認識装置
JPS6338994A (ja) * 1986-08-04 1988-02-19 松下電器産業株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
Middag et al. Automated intelligibility assessment of pathological speech using phonological features
Chan Using a test-to-speech synthesizer to generate a reverse Turing test
US5946654A (en) Speaker identification using unsupervised speech models
US8949127B2 (en) Recognizing the numeric language in natural spoken dialogue
EP0700031A1 (en) Confusable word detection in speech recognition
JPH11507443A (ja) 話者確認システム
JPH1083194A (ja) 話し手照合システムのための2段階群選択方法
Sethu et al. Speaker normalisation for speech-based emotion detection
JP4897040B2 (ja) 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム
JPS6024597A (ja) 音声登録方式
JPS62232691A (ja) 音声認識装置
JPS6059395A (ja) 音声標準特徴パタ−ン作成処理方式
CN110853674A (zh) 文本核对方法、设备以及计算机可读存储介质
JP2745562B2 (ja) ノイズ適応形音声認識装置
EP0782127A2 (en) A time-varying feature space preprocessing procedure for telephone based speech recognition
JP7024691B2 (ja) 非言語発話検出装置、非言語発話検出方法、およびプログラム
Akita et al. Unsupervised speaker indexing using anchor models and automatic transcription of discussions.
JPH0331275B2 (ja)
JPS616694A (ja) 音声登録方式
JPH0736481A (ja) 補完音声認識装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPS59195299A (ja) 特定話者音声認識装置
JPH0331274B2 (ja)
JPS6060697A (ja) 音声標準特徴パタ−ン作成処理方式
JPS59143200A (ja) 連続音声認識装置