JPS6060697A - 音声標準特徴パタ−ン作成処理方式 - Google Patents

音声標準特徴パタ−ン作成処理方式

Info

Publication number
JPS6060697A
JPS6060697A JP58168796A JP16879683A JPS6060697A JP S6060697 A JPS6060697 A JP S6060697A JP 58168796 A JP58168796 A JP 58168796A JP 16879683 A JP16879683 A JP 16879683A JP S6060697 A JPS6060697 A JP S6060697A
Authority
JP
Japan
Prior art keywords
pattern
patterns
feature
input
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58168796A
Other languages
English (en)
Inventor
教幸 藤本
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58168796A priority Critical patent/JPS6060697A/ja
Publication of JPS6060697A publication Critical patent/JPS6060697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 ■発明の技術分野 本発明は音声標準特徴パターン作成処理方式。
特に音声認識システムにおいて、槽重特徴・ξターンを
各辞書項目に対して1パターン宛の登録をする際、各辞
書項目に対して少なくとも3回以上の発声を行い、それ
らの発声から得られる入力Q’f 0:rパターンにつ
いて、平均の演算もしくは司別等を行い、最適な標準特
徴パターンの登録を可能とした音声標準特徴パターン作
成処理方式に門するものである。
(B)従来技術と問題点 一般に音声認識において、認識率を向上させるためには
、音声情報からどのような特徴パラメータを抽出し照合
に用いるかが重要であるが、そのシステムで定められた
特徴抽出によシ、各項l]を代表する標準特徴ノξラメ
ータとして、いかに最適なものを辞書に用意するかにつ
いても重要である。
特徴の抽出のし方や照合のし方が、いかに優れていても
、辞書中に登録される標準特徴パターンに。
雑音付加パターンや不明瞭発声パターン等の不良標準行
(7、Oターンが多ければ、認識率は向上しない。
標i虐待似)ぞターンは、辞■:中にディジタル情報で
記憶され、その数が多く2機械部品のように目にみえる
わけではなく、またすべての標準特徴ノ々クーンが一律
に使用されるわけではないので、一旦豆録されてしまう
と、上記不良標準特徴パターン、讃シl;%準特徴パタ
ーン等の検出は、容易ではない。
ところで1通常、認識対象となる1つの辞書項目につい
て、複数の標準特徴パターンが用意されることが多いが
、この場合でも、従来、各標準特徴パターン1個につき
、1回の発声から得られる入力物像パターンを標準とし
て登録するようにされていた。そして1例えば、単語(
単音節を含む)rあJ、rい」、「う」、「え」、・・
・・・・について。
2岡づつ標卓峙徴パターンを登録するとき、もし。
「あ」、「あ」、「い」、「い」、「う」、「う」。
・・・・・・と、2回連続発声によって、各標準特徴パ
ターンを抽出し登録していったとすると、1つの辞書項
目についての第1の標準特徴パターンと、第2の標準!
特徴パターンとの差が、一般に1革少となシ、複数個の
標準特徴パターンを用意することの意味が薄れる。そこ
で、まず最初、「あ」、「い」。
「う」、・・・・・・と発声して、それぞれ第1の標準
7F+j徴パターンを抽出して登録し2次に丑た。「あ
」。
「い]、「う」、・・・・・・と発声するかまたは発声
順番を変えて、第2の標準特徴パターンを登録するよう
にされていた。
しかし、上記従来の方式によれば、雑音が付加されたり
、あるいは不明瞭に発声された音μからも、標準特徴パ
ターンが作成されることとなるため、必ずしも妥当な標
準特徴パターンが登録されるとは限らなかった。
(0発明の目的と構成 本発明は上記問題点の解決を図シ、一般に同じ言葉を連
続して複数回発声すると、同じような発声になることに
着目して、1つの標準特徴パターンの登録にあたシ、3
回以上の発声による登録音声情鰻を利用し、不良標準特
徴パターンの登録を防止することを目的としている。そ
のため1本発明の音声標準特徴パターン作成処理方式は
、未知入力音声を音響分析して得られる入力特徴パター
ンと、予め辞書中の各項目に対応して格納された標バを
特徴パターンとの照合によって、音声認識を行う音声J
2識システムにおいて、1つの上記標準特徴パターンの
登Qについて少なくとも3回以上の登録音声を入力する
よう感成し、該登録音声から得られる入力11%’j 
徴/’?ターンをそれぞれ記憶するバッファと、該バッ
ファに格納された入力特徴パターンの平均的パターンま
たは互いに類似する入力特徴パターンの内の1つもしく
は互いに3頂似する入力特徴パターンの平均的パターン
を登録するパターン登録部とをそなえたことを特徴とし
ている。以下図面を参照しつつ実施例に従って説明する
0発明の実施例 第1図は音声パターンの分布と・標準特徴パターンとの
関係を説明するだめの図、第2図は本発明による処理概
要を説明するための図、第3図は本発明の一実施例構成
を示す。
亀1図において、A、B、Cの実線で囲まれた部分は、
ツクターン空間における実際の音声パターンの分布を示
し、 AxおよびA2は単語A(単ff 箆を含む。以
下同様。)に対する登録された標準!()徴パターン、
BlないしB3は単@Bに対する14711i特徴パタ
ーン、 C1は単語Cに対する標準特徴パターンを表わ
している。図示Cのように、1つの単語項目について、
1つの標準特徴パターンでカバーできる場合もあるが1
通常1図示A、Bのように、1つの項目について複数の
標1≠・特徴パターンを用意し、認識すべき音声ノぐタ
ーンの分布ぐ11囲全カバーするのが普通で6る。例え
ば、未知入力音声の入力特徴パターンXが抽出されると
、その入力特徴パターンXと各標準・1−テ徴パターン
A1゜A2.Bl、・・・とのマツチング圧部[tの随
1゛¥、を行い。
距離の小さい標準特徴パターンのHisするり1目を5
3識結果とする。そのため、もし、辞書に登録された標
準特徴パターンの中に、音声パターンのクナ布から外れ
た不良儲帛峙徴パターンがあれば、認識率は劣化するこ
ととなる。本発明は、このような妥当でない標準特徴パ
ターンの登録を防止しようとするものである。
そのため1本発明の場合、嬉2図を参照して後述する如
く、最初の登録時に、l標準特徴パターン当シ、少なく
とも3回以上の発声を入力する。
そして、その中から平均的なものが選出されるようにし
て、雑音等の影響や誤p発声による影響等を少々くする
ようにされる。
例えば、4回の発声により、単語rPJについての1つ
のξ準特徴パターンを登録するとする。
この登録のために発声した音声から抽出した特徴パター
ンが、それぞれPL、 P2. PG、 P4 であっ
たとすると9次のように登録すべき環準特徴パターンが
決定される。第2図(イ)図示の例の場合、パターン空
間において、特徴パターンPi、 P2. Ps、P+
の重心を概略演汀し、この重心に最も近い点を標準特徴
パターンとして選出して登録する。この場合、特徴パタ
ーンP3 が選出されることとなる。
第2図(ロ)図示の例の場合には、4つの特徴パターン
Pl、 P2. Ps、 P4 の平均値をめ、この平
均的パターンP、mを、標準特徴パターンとして登録す
るようにしている。また、第2図P1図示の如く。
例えば他の特徴パターンと大きく離れた特徴パターンP
2 を、不良である可能性が大きいとして除去し、残シ
の類似する特徴パターンPx 、 Ps 、 P4でも
って、この平均値をめるなどしてr ni (u l’
z徴パターンの平均的パターンPyylを登録標桑特徴
パターンとしてもよい。以上のような、岨出基it;1
%もしくはこれと同様な基準にょシ、蝮数回の発1(が
ら1つの標準特徴パターンを選出1作成し、登録するこ
とによって、質のよい辞書を作成することができる。特
に、3回以上の発声の2鴨合、第2図Peで説明したよ
うに、雑音、不明瞭発声などによる不良特徴パターンを
事前に検出して、予め除去することが可能である。
第3図は2本発明の一実施例栂成を示すブロック図であ
る。図中、1はマイクロホン、2は音・汀分析部、3は
パターン抽出部、4は切替部、5はカウンタ、6−1な
いし6−n、はパターン・バッファ、7はパターン登録
部、8は平均的パターン算出部、9は辞書、10は照合
判定部を表わす。
マイクロホン1から入力された音声信号は、音−3′5
分析部2において周波数分析される。音響分析部2は1
例えば帯域フィルタ群、パラメータ抽出回路等を有して
おシ、入力音声の特徴量(パラメータ)1例えば第1ホ
ルマント周波数に相当するモーメントIVilや、第2
ホルマント周波数に相当するモーメン) M2 や、さ
らには、低域電力や高域′ら力などを抽出し、これらの
特徴量に関するサンプル点を決定して、特徴量の時系列
情報を得る。
音・11分析部2において得られたノクラメータ時系列
清報は、パターン抽出部3に入力される。パターン抽出
部3は、このパラメータ時系列情報から。
入力音声の詩畝を表わす入力特徴パターンを抽出する。
切替部4は、パターン情報の登録または照合を2例えば
図示省略したキーボードからのモード切替指示によシ、
切シ替えるものである。
パターン・バッファ6−]〜6−nは、登録モードが選
択されているとき、登録音声に関する入力特徴パターン
を記憶し保持するものであるう最初の発声入力前にカウ
ンタ5は初期設定され、以後発声入力毎にカウンタ5は
更新される。そのときの発声入力から抽出された・特徴
パターンは、カウンタ5の値に対応するパターン・バッ
ファ6−1〜6−nの1つに格納される。
パターン登録部7は、登録モード時に、所定の回数の音
声全入力して、パターン・バッファ6−]。
〜6−nにパターンが用意されると、平均的パターンf
H[8によって、パターン中バッファ6−1〜6−nに
用意されたパターンから平均的な′1テ徴パターンを作
成または選出し、辞書9に登録項目名に対応して、その
平均的パターンを標準′1¥徴パターンとして登録する
。平均的パターン算出部8は1例えば第2図で説明した
如くにして If、回数の入力特徴パターンから、登録
すべき標準t1ケ徴パターンを算出する。なお、登録音
声の入力にあたっては、算出される標準特徴パターンの
安定性を考慮した場合、1つの項目名について、単語を
区切つて9例えば「あ」、「あ」、「あ」、「い」、「
い」。
「い」、「う」、「う」、「う」・・・・・・の如く、
それぞれ連続的に入力したほうが望ましい。このように
複数回の発声によって、1つの標準特徴ノ々クーンがめ
られることとなるので、不良な標準特徴パターンが登録
されることが防止される。
認識モードのときには、パターン抽出部3の出力は、照
合判定部10に供給される。照合判定部10は、辞’:
’j’ 9の内容をj顔次読出し、入力特徴パターンと
、辞書 9に登録されている標準特徴パターンとを1例
えば周知のダイナミック・プログラミング(DP)マツ
チング等によシ照合する。
照合の結果、マツチング距r、侘の小さい項目を認識)
関補または認識結果とすることにより、未知入力汁声の
認識を行う。
なお、上記複数回の発声による標4特徴ノ々ターンの登
録は、すべての辞詔4項目に対して適用される必要はな
く1例えば予め定められた辞書項目に対してのみ、適用
されるようにしてもよい。
■発明の詳細 な説明した如く本発明によれば、雑音付加・′ターンや
不明瞭発声パターン等の不良標準′1ケ信パターンをそ
のまま登録することが防止されるので。
辞書の品質が向上し、認識率を高めることが可能となる
【図面の簡単な説明】
第1図は一着声パターンの分布と標準′時rI:rパタ
ーンとの1ユフ係を説明するだめの図、第2図は本発明
による処理概要を説明するだめの図 i′l与3図は本
発明の一実施例構成を示す。 図中、lはマイクロホン、2は音褥分析部、3はパター
ン抽出部、4は切替部、5はカウンタ。 6−1〜6−ルババターン1バッファ、7しよパターン
登録部、8は平均的パターン弾出部、9は辞書、10は
照合判定部を表わす。 特許出願人 富士通株式会社

Claims (1)

    【特許請求の範囲】
  1. 未知入力音声を音響分析して得られる入力特徴パターン
    と、予め辞書中の各項目に対応して格納された槽重特徴
    パターンとの照合によって、音声1Tff 62を行う
    音声認識システムにおいて、1つの上記4票準特徴パタ
    ーンの登録について少なくとも3回以上の登録音声を入
    力するよう構成し、該登録音声から得られる入力特徴パ
    ターンをそれぞれ記憶するバッファと、該バッファに格
    納された入力特徴パターンの平均的パターンまたは互い
    に類似する入力特徴パターンの内の1つもしくは互いに
    類似する入力特徴パターンの平均的パターンを登録する
    パターン登録部とをそなえたことを特徴とする音声標準
    特徴パターン作成処理方式。
JP58168796A 1983-09-13 1983-09-13 音声標準特徴パタ−ン作成処理方式 Pending JPS6060697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58168796A JPS6060697A (ja) 1983-09-13 1983-09-13 音声標準特徴パタ−ン作成処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58168796A JPS6060697A (ja) 1983-09-13 1983-09-13 音声標準特徴パタ−ン作成処理方式

Publications (1)

Publication Number Publication Date
JPS6060697A true JPS6060697A (ja) 1985-04-08

Family

ID=15874630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58168796A Pending JPS6060697A (ja) 1983-09-13 1983-09-13 音声標準特徴パタ−ン作成処理方式

Country Status (1)

Country Link
JP (1) JPS6060697A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63169698A (ja) * 1987-01-08 1988-07-13 富士通株式会社 標準パタ−ン格納部管理方法
JPH05143093A (ja) * 1990-10-23 1993-06-11 Internatl Business Mach Corp <Ibm> 発声された単語のモデルを生成する方法および装置
WO2007111197A1 (ja) * 2006-03-24 2007-10-04 Pioneer Corporation 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5629294A (en) * 1979-08-20 1981-03-24 Tokyo Shibaura Electric Co Voice indentifier
JPS57102700A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) * 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS59195299A (ja) * 1983-04-20 1984-11-06 富士通株式会社 特定話者音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5629294A (en) * 1979-08-20 1981-03-24 Tokyo Shibaura Electric Co Voice indentifier
JPS57102700A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer
JPS584198A (ja) * 1981-06-30 1983-01-11 株式会社日立製作所 音声認識装置における標準パタ−ン登録方式
JPS59195299A (ja) * 1983-04-20 1984-11-06 富士通株式会社 特定話者音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63169698A (ja) * 1987-01-08 1988-07-13 富士通株式会社 標準パタ−ン格納部管理方法
JPH05143093A (ja) * 1990-10-23 1993-06-11 Internatl Business Mach Corp <Ibm> 発声された単語のモデルを生成する方法および装置
WO2007111197A1 (ja) * 2006-03-24 2007-10-04 Pioneer Corporation 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム
JPWO2007111197A1 (ja) * 2006-03-24 2009-08-13 パイオニア株式会社 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム

Similar Documents

Publication Publication Date Title
US8271282B2 (en) Voice recognition apparatus, voice recognition method and recording medium
WO1997037346A1 (en) Speech processing
US4910782A (en) Speaker verification system
JPS6247320B2 (ja)
JPS62232691A (ja) 音声認識装置
JP3130524B2 (ja) 音声信号認識方法およびその方法を実施する装置
JPS6060697A (ja) 音声標準特徴パタ−ン作成処理方式
JP2001083986A (ja) 統計モデル作成方法
JP2531227B2 (ja) 音声認識装置
JPS58223193A (ja) 多数単語音声認識方式
JP2002501637A (ja) 前選択と棄却クラスによる確実な識別
US6934680B2 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JP4236502B2 (ja) 音声認識装置
JP3011421B2 (ja) 音声認識装置
JP3036509B2 (ja) 話者照合における閾値決定方法及び装置
JP3514481B2 (ja) 音声認識装置
Wilpon et al. Connected digit recognition based on improved acoustic resolution
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JP2577891B2 (ja) 単語音声予備選択装置
JPS6059395A (ja) 音声標準特徴パタ−ン作成処理方式
JPH0457099A (ja) 音声認識装置
JPH06167992A (ja) 音声パターン作成装置およびそれを用いた標準パターン登録装置
JPS6136797A (ja) 音声セグメンテ−シヨン法
JP2005173007A (ja) 音声解析処理およびそれを用いた音声処理装置および媒体
JPH0331274B2 (ja)