JPS59195300A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59195300A
JPS59195300A JP7033183A JP7033183A JPS59195300A JP S59195300 A JPS59195300 A JP S59195300A JP 7033183 A JP7033183 A JP 7033183A JP 7033183 A JP7033183 A JP 7033183A JP S59195300 A JPS59195300 A JP S59195300A
Authority
JP
Japan
Prior art keywords
vowel
pattern
storage means
input
consonant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7033183A
Other languages
English (en)
Inventor
裕一 谷口
相良 良二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7033183A priority Critical patent/JPS59195300A/ja
Publication of JPS59195300A publication Critical patent/JPS59195300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声を音節を単位として認識する音声認識装
置に関するものである。
従来例の構成とその問題点 近年、音声認識装置は、ワードプロセッサーやコンピュ
ータの端末装置のキーボード入力の代わりの入力手段と
して実用化が始まろうとしている。
以下、図面を参照しながら、従来の音声認識装置につい
て説明を行う。
第1図は従来の音声認識装置の講成ケ示すものである。
第1図において、1は音声を電気信号に変換するマイク
ロホン等の入力手段、2はマイクロホン1によって変換
された電気信号を増幅するマイクロンズ、3はマイクロ
アンプ2からの電気信号から音声の特徴を抽出手段で、
通常、8チヤネルから16チヤネルのバンドパスフィル
ター等を使用している。4は特徴抽出手段3によって抽
出された音声の特徴ケディジタル信号に変換するへ/D
変換手段、5は標準パターン記憶子゛段であり、話者が
認識させたい音声ケ、あらかじめA/D変換手段4によ
ってディジタル化されたパターンで認識させたい音声の
特徴を記憶しておく。6は入カバターン記憶手段で、認
識の際に発声した音声の特徴を記憶しておく。
標準パターン記憶手段5は2つの部分5a、5bに分れ
ており、5aは標準パターンのうち、母音部(アー1a
1.イ=Iil、ウー1u1.工=1e1.オー10+
撥音/−JNl)の標準パターン全記憶する標準パター
ン母音部記憶手段で、第2図に示すように、5母音1a
1.fil、1u1,101,101と撥音IN+の母
音部の特徴が記憶され、5bは標準パターンのうち、子
音部の標準パターンを記憶する標準パターン子音部記憶
手段であり、第3図に示すように後続母音が、それぞれ
、lal、fil、Iul、1e1,101ごとに分け
て子音部の特徴が記憶されている。
入カバターン記憶手段6も2つの部分6a。
6bに分かれており、6aは入カバターンのうち、母音
部の入カバターンを記憶する入カバターン母音部記憶手
段、6bは入カバターンのうち子音部の入カバターンを
記憶する入カバターン子音部記憶手段である。7は認識
に際して標準パターン記憶手段5に既に登録され記憶さ
れている複数の標準パターンと、入カバターン記憶手段
6に入力され記憶されている入カバターンとを比較し、
許容される範囲内で類似度の最も大きい標準パターンを
、入カバターンと同一パターンとして認識する認識処理
手段である。8は認識手段7によって認識された入カバ
ターンに対応した信号を出力する出力手段である。9は
出力手段8によって出力された信号に応じて制御され得
る被制御機器である。
以上のように構成された音声認識装置について以下にそ
の動作について説明する。
まず、話者は切換スイッチ10を登録モードに切換え、
認識させたい音声を入力手段1に向って発声し、マイク
アンプ2全通した後、特徴抽出手段3により、音声の特
徴全抽出し、A/D変換手段4によってディジタル化さ
れる。
第4図A、第4図B、第4図Cには、それぞれ音声ア(
−1aI)、ヤ(−lya I)、ワ(=l W−1)
の音声パワーの時間変化勿、第5図A。
第5図B+第5図Cには、それぞれ音声ア(=1a1)
、ヤ(=lyaI)+ワ(=l W−1) 。
の音声スペクトラムの時間変化金示す。音声スペクトラ
ムは音声の特徴を表わす一種のパラメータで、特徴抽出
手段3に、複数個のバンドパスフィルターを用いること
によって得ることができ、音7’jfハワーは複数個の
バンドパスフィルターの出力を加算することによって得
られる。
標準パターン母音部記憶手゛段5aは、特徴抽出手段3
及び、A/D変換手段4によって得られた音声の特徴、
例えば、上述したような音声スペクトラムのうち第6図
Aのt2の区間、単母音音節la+の母音定常部に相当
する区間の特徴を記憶し、標準パターン子音部記憶手段
5bは、第6図へ〜Cの区間t1に、それぞれ、音声1
a1゜1ya1.l”lの子音部に相当する区間の特徴
を記憶する。
このようにして、音声の特徴を登録する処理が行われる
然る後、話者は切換スイッチ10i認識モードに切換え
、あらかじめ登録されている音声のうち、認識させたい
音声?入力手段1に向って発声し、マイクアンプ2全通
した後、特徴抽出手段3により、この音声の特徴全抽出
し、A/D変換手段4によってディジタル化され、入カ
ッくターン母音部記憶手段6aは、A/D変換手段4に
7よってディジタル化された入力音声の母音部の特徴、
すなわち、音声スペクトラムの区間t2の音声ノくワー
を、人カバターン子音部記憶手段6bは、A/D変換手
段4によってディジタル化された入力音声の子音部の特
徴、すなわち、音声スペクトラムの区間t1の音声パワ
ーを、一旦記憶し、認識処理手段7によって、まず、入
カバターン母音部記憶手段6aに記憶されている入力音
声の母音部の特徴と、標準パターン母音部記憶手段5a
に登録されている第2図に示すような複数個の母音部(
+ −1=ア、111−イ、1u1−ウ、1e1−工、
1o1−オ、lN1−ン)とを比較し、許容される範囲
内で、類似度の最も大きい標準パターンを決定し、この
時の人力音声パターンに含まれる母音を認識する。
次に入カバターン子音部記憶手段6bに記憶されている
子音部の特徴と、標準パターン子音部記憶手段5bK登
録されている第3図に示すような複数個の子音部(1a
1−ア、I k +−力、・・・・・・1b01−ボ、
 I poI−ポ)のうち、上記識別母音と同一の母音
を後続母音に持つ複数個の子音部とを比較し、許容され
る範囲内で、類似度の最も大きい標準パターンがこの時
の入力音声と認識され、この認識に基づいて出力手段8
から人力音声に対応した信号出力が得られ、例えばワー
ドプロセッサー等の被制御機器9を接続し、信号出力に
基づいた制御を行う。
しかしながら、上記のような音声認識装置では、人力音
声をまず入力音声中に含まれる母音を認識し、然る後、
認識された母音と同一の母音を後続母音にもつ子音に限
定して入力音声の認識を行うため、母音の認識を誤れは
、入力音声の認識、が正しく行われないという欠点を有
していた。
発明の目的 本発明は、上記欠点に鑑み、母音の認識を確実に行う音
声認識装置全提供するものである。
発明の構成 本発明は、入力音声パターン中の母音を標準パターン中
の特定の母音と認識した後、認識された母音を後続母音
としてもつ子音の認識全行う際に、認識されにくい母音
に対しても、母音の変形パターンを標準パターン母音変
形記憶手段に登録することにより母音認識を確実に行い
、その母音を後続母音としてもつ子音のJ忍識を行うこ
とにより、認識率の向上全図るものである。
実施例の説明 以下本発明の一実施例について、図面を参照しながら説
明する。
第6図は本発明の音声認識装置の構成を示すものである
。第6図において、1は音声r眠気信号に変換するマイ
クロホン等の人力手段、2はマイクロホン1によって変
換された電気信号ケ増幅するマイクアンプ、3はマイク
アンプ2からの電気信号から音声の特徴ケ抽出する特徴
抽出手段、4は特徴抽出手段3によって抽出され−た音
声の特徴音ディジタル信号に変換するA/D変喚手段、
5は標準パターン記憶手段であって、2つの部分5a。
5bに分かれており、話者が認識させたい音声ケあらか
じめA/D変換手段4によってディンタル化されたパタ
ーンで認識させたい叶声の特徴を記憶しておく。6aは
標準パターン母音部記憶手段で、標準パターンのうち母
音部の入カバターンを記憶する。5a’は標準パターン
のうチ、61り庁の変形パターン金記憶する母音変形記
憶手段で、第7図に示すように5母音の変形パターン1
a“1゜Ii’ l 、 lu’l 、 Ie’l 、
 lo’lが記憶されている5bは標準パターンのうち
、子音部の標準パターンを記憶する標桑パターン子音部
記憶手段であり、第3図に示すように後続母音が、それ
ぞれ、laI?lit、lul、101,101ごとに
分け、子音部の特徴が記憶されている。
6aは入カバターンのうち、母音部の人カバターンを記
憶する入カバターン母音部記憶手段、6a’は入カバタ
ーンのうち母音変形パターンを記憶する入カバターン母
音変形記憶手段、6bは入カバターンのう匂子音部の入
カバターンを記憶する人カバターン子音部記憶手段であ
る。7は認識に際して、各記憶手段5a、5a“、rs
bに既に登録され記憶されている複数の標準パターンと
各記憶手段6a、6a’、6bに入力され記憶されてい
る入カバターンとを比較し、許容される範囲内で類似度
の最も大きい標準パターンを、入力・くターンと同一パ
ターンとして認識する認識処理手段である。8は認識処
理手段7によって認識された入カバターンに対応した信
号を出力する出力手段である。9は出力手段8によって
出力された信号に応じて側脚され得る被制御機器である
本発明の音声認識装置の構成と従来例の音声認識装置の
構成の相異は、上述のように母音変形部記憶手段5a”
と6a’にあり、第6図に示すような構成となっている
以北のように構成された音声J忍識装置について、以下
その動作について説明する。
まず、話者は切換スイッチ10を登録モードに切換え、
認識させたい音声を入力手段1に向って発声し、マイク
アンプ2全通した後、特徴抽出手段3より音声の特徴を
抽出し、A/D変換手段4によって、ディジタル化され
る。
標準パターン母音記憶手段5aおよび5a’は、特徴抽
出手段3及びA/D変換手段4によって得られた音声の
特徴、例えば、音声スペクトラムのうち、単母音音節の
母音定常に相当する区間の特徴を記憶し、標準パターン
子音部記憶手段5bは、音声の子音部に相当する区間の
特徴を記憶する。
この時、後続母音がlaIの場合は、laI段に、後続
母音がIll、lul、1e1.+01の場合は、それ
ぞれ、lul段、lul段、101段。
101段に登録する。このようにして、音声の特徴を登
録する処理が行われる。
然る後、話者は切換スイッチ1ot−、;忍識モードに
切換え、あらかじめ登録されている音声のうち、認識さ
せたい音声ケ入力手段1に向って発声し、マイクアンプ
2全通した後、特徴和1出手段3により、音声の特徴を
抽出する。人カッくターン母音言己憶手段6aおよび6
a’は、A/D変換手段4によってディジタル化された
人力音声の母音名じの特徴蛍、1だ、入力・くターン子
音部d己す意手段6bは、A/D変換手段4によってデ
ィジタルイヒされた入力音声の子音部の特徴を一旦記憶
する。言忍識処理手段7によって、まず、入カッくター
ン母音台at己す意手段6aおよび6a’に記憶されて
いる入ノJ音声の母音部の特徴と、標準ツク゛ターン母
音音μJ己す意手段6aおよびs aIに登録され記憶
さ丘ている複数イ固の母音部(lal=ア、111−イ
、1u1−ウ。
1e1−工、101−オ、1Nl=7、l −’ I 
=アの変形パターン、li’l=イの変形)(ターン、
1u11−ウの変形)々ターン、1e゛1−工の変形・
くターン、lO’l−オの変形ノ(ターンとをそれぞれ
比較し、許容されている範囲内で、類似度の最も大きい
標準パターンをそれぞれ求め、これらを入力音声パター
ンに含まれる母音の第1候補、第2候補とする。
次に、人カバターン子音部記憶手段6bに記憶されてい
る子音部の特徴と、標準パターン子音部記憶手段5bに
登録されている第3図に示すような複数個の子音部のう
ち、識別11音の第1候補と同一の母音段の複数個の子
音部とを比較し、許容される範囲内で、類似度の最も大
きい標準パターンが、この時の人力音声の子音と認識さ
れる。
もし、この認識結果が変形パターンをもたらす子音の行
ならば、母音変形邪の認識結果である第2候補全優先さ
せ、これr母音とし、上記子音部の比較で得られた子音
と組合せて認識結果とする。
本発明によれば、例えば、入力音声がIya 1の場合
、後続母音1−1が子音1ylの影響により単母音のl
alと異なった特徴を持ち、本来認識されるべき後続母
音1aIを誤ってIeIと認識されやすい。そこで標準
パターン母音変形部記憶手段5a’に1y&1の後続母
音を、単母音1−1の変形パターン1a“1として登録
することにより、人力音声が正しく認識される。
この認識に基づいて、出力手段8から入力音声に対応し
た信号出力が得られ、例えば、フードプロセッサー等の
被制御機器を接続し、信号出力に基づいた制御全行う。
以上のように本実施例によれは、まず、母音を認識し、
その母音に基づいて子音全認識する際に、母音識別が誤
りやすい音声は、その音声の母音の変形パターン全登録
することにより、入力音声の認識時に、母音識別が正し
く行なわれる。
第8図A−TB、第9図A、B、第10図八、B1第1
1図A 、 B、第12図A、Hにそれぞれ181段、
111段、lul段、181段、101段の、従来の音
声認識装置の認識実験の認識結果と、上記実施例の認厳
結果ケコンノーーージョン°マトリックスで、それぞれ
図示する。
第1表は、第8図A、B〜第12図A、Bのコンフユー
ジヨン・マトリックスより認識率を求めた結果で、単位
は係である。第1表かられかるように、lal琲とlu
I段の認識率は、それぞれ、5.0%、6.6%向上し
ている。
発明の効果 本発明の音声認識装置は、入力音声パターン中の母音を
標準パターン中の特定の母音と認識した後、認識され゛
た母音を後続母音としてもつ子音の認識を行う際に、認
識されにくい母音に対してはその母音をも、標準パター
ン母音変形記憶手段に母音変形パターンとして登録する
ことにより母音認識r正しく行い、その母音を後続母音
としてもつ子音の認識を行う認識処理手段を設けること
により、認識率の向上を図ることができ、その実用的効
果は大きい。
【図面の簡単な説明】
第1図は従来の音声認識装置の構成を示すブロック図、
第2図は標準パターン母音部記憶手段に登録記憶される
音声パターンを示す図、第3図は従来の音声認識装置に
於て標準パターン子音部記憶手段に登録、記憶される音
声パターンを示す図、第4図A−Cは各辞意のぎ声パワ
ーの時間変化を示す図、第6図A−Cは各音声の音声ス
ペクトラムの時間変化を示す図、第6図は本発明の音声
認識装置一実施例の構成を示すブロック図、第7図は本
発明の音声認識装置に於て標準パターン母音変形部記憶
手段に登録、記憶される音声パターンを示す図、第8図
A、B〜第12図A、Bは各母音段の従来と本発明実施
例の認識結果のコンヒーージョンマトリノクスを示す図
である。 1・・・・・・人力手段、2・・・・・・マイクアンプ
、3・・・・・・特徴抽出手段、4・・・・・・A/D
変換手段、5a・・・・・・標準パターン母音部記憶手
段、6 a’・・・・・・標準パターン母音変形部記憶
手段、6b・・・・・・標準パターン子音部記憶手段、
6a・・・・・・入カバターン母音部記憶手段、6 a
’・・・・・・入カバターン母音変形記憶手段、6b・
・・・・・人カバターン子音部記憶手段、7・・・・・
・認識処理手段、8・・・・・・出力手段、9・・・・
・・被制御機器。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第4図    第5図 第8図 第10図 第11図

Claims (1)

    【特許請求の範囲】
  1. 音声の特徴ベクトルを標準パターンとして予め登録する
    標準パターン記憶手段と、入力された音声の特徴ベクト
    ルを入カバターンとして記憶する入カバターン記憶手段
    と、前記標準パターンと前記入カバターンとを比咬し、
    前記標準パターン中の前記人力パタ一ンに対応する特定
    の音声パターンを識別する認識処理手段とを備え、前記
    標塾パターン記憶手段と前記入カバターン記憶手段はそ
    れぞれ、ju音パターンを記憶する母音部と、子音パタ
    ーンを記憶する子音部と、前につく子音によって母音パ
    ターンが影響を受けて変形する一群の母音変形パターン
    を記憶する母音変形部とを有し、前記認識処理手段は、
    前記標準パターン記憶手段と前記入カバターン記憶手段
    の母音部同志の識別結果に基いてP音部同志を比慣し、
    その結果が後続母音のIJ音パターンに影響を与える子
    音ならば、前記母音変形部同志の識別結果を優先しこれ
    を母音として認識することを特徴とする音声認識装置。
JP7033183A 1983-04-20 1983-04-20 音声認識装置 Pending JPS59195300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7033183A JPS59195300A (ja) 1983-04-20 1983-04-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7033183A JPS59195300A (ja) 1983-04-20 1983-04-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPS59195300A true JPS59195300A (ja) 1984-11-06

Family

ID=13428334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7033183A Pending JPS59195300A (ja) 1983-04-20 1983-04-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59195300A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269198A (ja) * 1986-05-16 1987-11-21 日本メクトロン株式会社 単音節音声認識装置
JPH02203396A (ja) * 1989-02-01 1990-08-13 Sharp Corp 音声の特徴抽出装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269198A (ja) * 1986-05-16 1987-11-21 日本メクトロン株式会社 単音節音声認識装置
JPH02203396A (ja) * 1989-02-01 1990-08-13 Sharp Corp 音声の特徴抽出装置

Similar Documents

Publication Publication Date Title
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
JP4867804B2 (ja) 音声認識装置及び会議システム
JPS58130393A (ja) 音声認識装置
JPS6147440B2 (ja)
JPS59195300A (ja) 音声認識装置
JPS59160197A (ja) 音声認識装置
JPS60129795A (ja) 音声認識方式
JPH0194398A (ja) 音声標準パターンの作成方法
JPS6336678B2 (ja)
JPS6135498A (ja) 音声認識装置
JPS6070497A (ja) 音声認識装置
JPS61256397A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPH0316038B2 (ja)
JPH01155399A (ja) 単語音声認識方式
JPS607492A (ja) 単音節音声認識方式
JPS59211098A (ja) 音声認識装置
JPS62164097A (ja) 音声判別方式
JPS63161500A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPS62218997A (ja) 単語音声認識装置
JPS63259689A (ja) 音声認識応答装置
JPS6287993A (ja) 音声認識装置
JPS59180598A (ja) 音声入力方式
JPS62115498A (ja) 無声破裂子音識別方式