JPS60125899A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60125899A
JPS60125899A JP23387083A JP23387083A JPS60125899A JP S60125899 A JPS60125899 A JP S60125899A JP 23387083 A JP23387083 A JP 23387083A JP 23387083 A JP23387083 A JP 23387083A JP S60125899 A JPS60125899 A JP S60125899A
Authority
JP
Japan
Prior art keywords
voice
power
segment boundary
signal
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP23387083A
Other languages
English (en)
Inventor
相良 良二
楠原 久代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP23387083A priority Critical patent/JPS60125899A/ja
Publication of JPS60125899A publication Critical patent/JPS60125899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は一子め登録しである音声の標準パターンを用い
て入力音声を認識する音声認識装置に関する。
従来例の構成とその問題点 近年−人間−機械系の入力手段として音声がθぞ目を集
めており、各種の音声認識装置が部品化されている。こ
の様な音声認識装置には単語単位の認識を行なうものと
、単音節単位の認識を行なうものとがあり、いずれの場
合でも語頭やセグメン)・境界の検出手段の精度が認識
率に大きく影響を及ぼし、音声入力装置の使い易さを決
める大きな装置となる。そこで単音節認識では母音と子
音のセグメント境界を正確に検出する方法が多数提案さ
れ、ている。寸だ単語認識においても、語頭の音節のセ
グメント境界は語頭の位置合わせに有用である。
以下第1図を参照しながら、従来の音声認識装置につい
て説明する。
同図において、1は音声を電気信号に変換するマイクロ
フォン等からなる入力手段、2は入力手段1からの電気
信号をティジタル化するA/D変換手段、3ばA/D変
換手段2によってティジタル化された音・車信号から母
音と子音のセグメント境界を検出するセグメント境界検
出手段−4はセグメント境界検出手段3に依って検出さ
れたセグメント境界を基準にして上記A/D変換手段2
の出力から音声の特徴を抽出する特徴抽出手段、5は上
記特徴抽出手段4に依って抽出された音声の特徴を入カ
バターンとして一時的に記憶しておく入カバターン記憶
手段、6は認識対象となる複数個の音声の特徴を標準パ
ターンとして予め記憶せしめておく標準パターン記憶手
段、7は上記標準パターン記憶手段6あるいは土肥入カ
バターン自己憶手段了と上記特徴抽出手段4とを接続す
るモード切換スイッチであり、標準パターン記憶手段6
に音声の特徴を予め記憶せしめる登録モードと入カバタ
ーン記憶手段5に音声の特徴を記憶せしめる認識モード
とを選択する手段である−、8は−に記入カバターン記
憶手段6に記憶された入カバターンと上記標準パターン
記憶手段6に記憶された複数個の標準パターンとを比較
し入力音声を特定の単語あるいは単音節と認識する認識
処理手段−9は上記認識処理手段8に依って認識された
ηう詔あるいは単音節に対応する信号を出力する出力手
段である。
上記のように構成された音声認識装置について、以下具
体的に動作を説明する。
まず登録モード時には、モード切換スイッチ7をA側に
接続し一上記出力手段9より出力さノ1−る各種の出力
信号に対応した単語捷だは単音節を発声して入力手段1
に入力する事に依って、音声の登録が為される。即ち一
人力された音声を入力手段1に依って電気信号に変換し
、この電気信号を上記A/D変換手段2によりティ/タ
ル化し、このティ/タル化された音声信号よりセグメン
ト境界検出手段によって母音と子音のセグメント境界を
検出し、このセグメント境界を基準にして特徴抽出手段
4により音声の特徴を抽出して、標準ノくターン記憶手
段6Vrcこの音声の特徴を登録する。
次に認識モード時には、モード切換スイ、ノチ7をB側
に接続し、登録モード時に登録された複数個の単R4た
は単音節の内から所望のものを入力手段1に入力すれば
、認識処理手段8によって入カバターンに最も類似して
いると判定された標準パターンに対応した信号が出力手
段9から出力さ7する。即ち一人力手段1に入力されて
A/D変換手段2によってティ/タル化された音声は、
セグメント境界検出手段3によって検出されたセグメン
ト境界を基準Vこして特徴抽出手段4により特徴パター
ンに変換され、一旦入力パターン記憶手段らに記憶され
た後−標準パターン記憶手段6に記憶されている複数個
の標準パターンと比較さバーて一最も類似している単語
または単音節に対応した信号が出力手段9から出力され
る。
上記のように構成された音声認識装置では、母音と子音
のセグメント境界の検出精度が認識率に大きな影響を及
ぼす。そこで種々のセグメント境界検出手段 パワーと標準エンベロープとの類似度を用いる方法の有
効性が報告さハ、でいる。以下、第2図を参照しながら
、従来のセグメント境界検出手段3について説明する。
第2図は従来のセグメント境界検出手段3のブロック図
である。同図において、3aは母音のボルマン!・の帯
域にあわせたフィルタ、3bは上記フィルタ3aの出力
の対数パワーを計算する対数パワー計算手段−30は予
め定めておいた標準エンベロープを記憶しておく標準エ
ンベローフ記憶手段、3dは上記対数パワー計算手段3
bの出ヵと標準エンベロープとの距離を計算する距離計
算手段、3eは上記距離計算手段3dに依って計算さね
5た距離が最小となる点をめ、その点をセグメント境界
として出力する境界検出手段である。
上記のように構成されたセグメント境界検出手段につい
て一以下具体的に動作を説明する。
A/D変換手段2によってディジタル化された音声信号
は、フィルタ3aに依って3波されて母音の部分で大き
な出力が得られる信号に変換され一対数パワー計算手段
3bによって整流・平滑化されて音声のホルマントの存
在する帯域のノ(ンド・パワーの対数値(第3図、1o
)が出力される。
このバンドパワーは、距離計算手段3dによって標準エ
ンベロープ記憶手段3Cに記憶されている標準エンベロ
ープ(第3図、11)を1点ずつシフトしたものと比較
され、両者の距離(第3図。
12)が割算される。即ち、標準エンベロープf(n)
(n=−n、 、−n、−1−1,−=・−、−1、0
、1、−=・。
n2;ただしn、)O+ n 2 > O)をm点だけ
シフトしたものと対数バンド・パワーの波形11oq 
(p(n))(n−〇、1.2、−−−、N ;だたし
N)>O) との各点での差の絶対値和 rn==n、 + n、+11 ””” I N”2あ
るいは二乗和 が各mについて計算される。次にd、(m) あるいは
d2(m)が最小となるmが境界検出手段3eによって
検出され、セグメント境界として出力される。
しかし、上記のように構成された音声認識装置では、有
声子音など子音部に比較的大きなノくワーを持つ子音で
一語頭すなわち子音の先頭をセグメント境界と見なして
し捷うという誤り、ひいては認識誤りが生じ易いという
欠点を有していた。セグメント境界の検出誤りの例を第
4図に示す。同図で点線で示しているのが本来のセグメ
ント境界である。
発明の目的 本発明は上述の欠点を解消し、語頭の子音部に比較的大
きなパワーを持つ音節が入力された場合でも正確なセグ
メント境界検出、ひいては正確な認識を行なうことので
きる音声認識装置を提供することを目的とする。
発明の構成 本発明は、パワー計算手段から出力されるノ(ンド・パ
ワーの波形より−その差分波形まだはさらI/(その高
次の差分波形を算出しそれらを一定の重みで加算して、
バンド・・くワー波形の変動情報を表わすパラメータを
算出する傾き・ズラメータ計算手段と、上記傾き〕々ラ
メータ計算手段によって計やさハ、た傾きパラメータが
最大となる点を検出する最大値検出手段とを−セグメン
ト境界検出手段内に備えた廿声認識装置であり、音声の
・ぐンド・パワー波形そのものの変化及び変化の速さか
ら子音部と母−音部の境界を検出することにより一語頭
の子音の大きさに左右されない安定なセグメント境界を
検出することができ−高い認識率を得ることのできるも
のである。
実施例の説明 以下、本発明の実施例について図面とともに説明する。
第6図は本発明の一実施例における単音節認識装置のセ
グメント境界検出手段のブロック図である。
同図において−38はフィルタで第2図の構成と同じも
のである。第2図の構成と異なる点は、上記フィルタ3
aの出力のパワーを計算するパワー計算手段3fと一上
記パワー割算手段3fに依って計算された母音パワーの
波形の差分及び高次の差分を計算し、両者をある重みで
加算して母音パワーの変化及び変化の速さを表わすパラ
メータを算出する傾きパラメータ計算手段3qと−」−
記傾きパラメータ計算手段3qに依って算出されたパラ
メータの平滑化を行なう平滑化手段3hと、上記平滑化
手段3hより出力される平滑化された傾きパラメータが
最大になる点を検出する最大点検出手段31とを設けた
点である。
以上のように構成したセグメント境界検出手段について
、以下具体的に動作を説明する。
入力手段1およびA/D変換手段2に依ってティ/タル
信号に変換された単音節音声はフィルり3aに依って3
波されて母音部で大きな出力が得られる信号に変換され
−・くワー計算手段3fに依って整流・平滑化さh−て
・・ンド・・くワーp (n)(n−〇、1.・・・ 
、N)(第6図、13)が出力されるn」−記/・ンド
・ノくワーp (n)は、傾きノくラメータ計勢手段3
qに依ってm点離れた点の間の差分を表わす信号 q(n) −p(n+m/2) −p(n−m/2)(
n−毛ユ+1.・・・・N−晋)  2 に変換され(第6図、14)−さらにβ点離ね、た点の
間の差分(第6図、15) β l r (n)=q (n+−) −q (n−−)2 2 すなわちp(n)の2階差分が計算され、最後にq (
n)とr(n)がm1対m2の重みで加算され、傾きパ
ラメータ ” (n) −m、 q(n) +m2r (n)(r
n 1. n’)2は定数) として出力される□上記類きパラメータS (n)は、
平滑化手段3hによって平滑化され余分な凹凸が除去さ
れて、・・ンド・パワーの変化と変化の速さの情報を含
んだパラメータt(n)(第6図、16 )として出力
される。上記平滑化手段3h」:り出力されたパラメー
タt (n)が最大となる点(第6図。
17)が最大点検出手段31によ−て検出さノ1゜、セ
グメント境界として出力さ引−る。
以上のように本実施例によねば、パワー削豹手段3fと
傾きパラメータ計算手段3qと平滑化手段3hと最大点
検出手段31とを設けることにより、比較的大きなパワ
ーを持つ有声子音の場合でも、パワー波形の急檄な変化
点をとらえることができ、より正確なセグメント境界の
検出を行なうことができる。単音節認識ではセグメント
境界を基準にして物像抽出を行なうだめ−セグメント境
界の検出が正確であるほど認識装置の認識率が向上し、
使い易さの面で効果は大きい1、なお、本実施例では認
識対象を単音節に限定したか一本セグメント境界検出手
段は単語の語頭の?1′l音節にも適用可能で、単語の
語頭の時間合わせがより正確r(行なえるようになり認
識率の向上につながる。寸だ、パワー計算手段3fには
対数パワー計9手段3bを用いても良く、平滑化手段3
hを特に用いる必要もない○捷だ、傾きパラメータとし
ては、さらに高次の差分を用いても良く、2階差分捷て
に限ピする必要はない。
発明の効果 以−1−のように本発明は、母音パワーの波形から変化
の様子を表わすパラメータを抽出する傾きパラメータ針
設手段と−そのパラメータが最大トなる点を検出する最
大点検出手段を設けることにより、子音部力パワーの大
きさによらない正確なセグメント境界の検出を行なうこ
とができ、その結果l’;51い認識率が1号られるよ
うになり、その効果は犬なるものがある。
【図面の簡単な説明】
第1図は従来の音声認識装置のブロック図、第2図は同
装置のセグメント境界検出部のブロック図−第3図は従
来のセグメント境界検出の原理図〜第4図はセグメント
検出誤りの例を示す原理図、第6図は本発明の一実施例
における音声認識装置のセグメント境界検出手段を示す
ブロック図、第6図は本実施例のセグメント境界検出の
原理図である。 1・・・入力手段−2・・ A/D変換手段、3・・・
・セグメント境界検出手段、3a・・フィルタ、3b・
・ ・対数パワー計算手段、3c・・・・[4工ンベロ
ープ記憶手段−3d・・・距離計算手段、3e・・・・
境界検出手段、3f・・・・・パワー計算手段、3q・
・・・傾きパラメータ計算手段、3h・・・・平滑化手
段、31・・・・最大点検出手段、4・・・特徴抽出手
段−5・・・・入カバターン記憶手段、6・・・・標準
パターン記憶手段、7・・・・・・モード選択スイッチ
、8・・・・・認識処理手段−9・・・・・・出力手段
、10・ 対敬化・・ント・パワー波形、11・ 標準
エンベロープ、12 −バンド・パワー波形と標準エン
ベロープの距離、13・ バンド・パワー波形、14・
・・ンドパワーの一階差分波形、15 ・・・・ント・
パワーの2階差分波形、16・・・・平滑化された傾き
パラメータ、17・・・・・検出され、たセグメント境
界。 代、F!11人の氏名 弁理士 中 尾 敏 男 ほか
1名図 4図

Claims (1)

    【特許請求の範囲】
  1. 人力された音声を電気信号に変換する入力手段と、上記
    電気信号をディ/タル化する変換手段と、−に記ティ/
    タル化された音声信号から上記音声の母音部と子音部の
    セグメント境界を検出するセグメント境界検出手段と一
    十記セグメント境界検出手段によって検出された上記セ
    グメント境界を基W4にして上記母音部と上記子音部の
    特徴を抽出する特徴抽出手段と、」二記特徴抽出手段に
    よって抽出された上記音声の特徴を入カバターンとして
    記憶する入カバターン記憶手段と、予め入力しておいた
    音j侶から」二記特徴抽出手段によって抽出されプこ7
    P、lr徴を標準パターンとして複数個記憶しておく標
    7q+パターン記憶手段と一上記標準パターン記憶手段
    に記憶されている各標準パターンと上記入カバターンと
    を比較し上記入カバターンを特定の標sイ/パターンと
    認識する認識処理手段と、上記認識処理手段によって認
    識された上記特定の標準パターンに対応した信号を出力
    する出力手段とをf+iiiえ、上記セグメント境界検
    出手段は、上記ティ/タル化された音声信号から上記音
    声のパワー波形を(ト)出するパワー計算手段と、上記
    パワー波形の各点における傾きパラメータを計神−する
    バラメー村1算手段と、上記パラメータ割算手段の結果
    の最大点を検出する最大点検出手段とを具備することを
    特徴とする音声認識装置。
JP23387083A 1983-12-12 1983-12-12 音声認識装置 Pending JPS60125899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23387083A JPS60125899A (ja) 1983-12-12 1983-12-12 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23387083A JPS60125899A (ja) 1983-12-12 1983-12-12 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60125899A true JPS60125899A (ja) 1985-07-05

Family

ID=16961859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23387083A Pending JPS60125899A (ja) 1983-12-12 1983-12-12 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60125899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006271369A (ja) * 2005-03-02 2006-10-12 Nippon Sheet Glass Co Ltd 生化学用容器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006271369A (ja) * 2005-03-02 2006-10-12 Nippon Sheet Glass Co Ltd 生化学用容器

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS60125899A (ja) 音声認識装置
Villing et al. Performance limits for envelope based automatic syllable segmentation
JP3091537B2 (ja) 音声パターン作成方法
JPS6048100A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS60125898A (ja) 音声認識装置
JPS6148897A (ja) 音声認識装置
JPH0343639B2 (ja)
JPH0419700A (ja) 音声パターンマッチング方法
JPS61183699A (ja) 音声認識装置
JPS61177000A (ja) 音声パタ−ン登録方式
JPS6126679B2 (ja)
JPH0316038B2 (ja)
JPS6070497A (ja) 音声認識装置
JPS6375800A (ja) 音声認識装置
JPS61123892A (ja) 音声認識装置
JPS6256998A (ja) 子音区間検出装置
JPS62280800A (ja) 破裂子音識別方式
JPS62217298A (ja) 音声認識装置
JPS6391700A (ja) 音声認識装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS58116595A (ja) 単語音声認識装置
JPS595294A (ja) 音声認識装置
JPS63142397A (ja) 音声認識装置