JPS6141198A - 単音節単語認識装置 - Google Patents
単音節単語認識装置Info
- Publication number
- JPS6141198A JPS6141198A JP16181784A JP16181784A JPS6141198A JP S6141198 A JPS6141198 A JP S6141198A JP 16181784 A JP16181784 A JP 16181784A JP 16181784 A JP16181784 A JP 16181784A JP S6141198 A JPS6141198 A JP S6141198A
- Authority
- JP
- Japan
- Prior art keywords
- input
- word
- pattern storage
- section
- storage section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、単音節音声および単語音声を認識する単音節
単語音声認識装置に関するものである。
単語音声認識装置に関するものである。
従来例の構成とその問題点
近年、人間−機械系の入力手段として音声が注目を集め
ており、各種の音声認識装置が開発され商品化が始まっ
ている。認識方式には、連続音声認識、単語音声認識、
単音節音声認識等があるが現在、実用化されているのは
、単語音声認識、単音節音声認識がほとんどを占める。
ており、各種の音声認識装置が開発され商品化が始まっ
ている。認識方式には、連続音声認識、単語音声認識、
単音節音声認識等があるが現在、実用化されているのは
、単語音声認識、単音節音声認識がほとんどを占める。
この二種の認識方式に関しては、そのハードウェア規模
および構成がほぼ同一であることから、同一の装置で単
語と単音節が認識できるようにしたものとして単音節単
語認識装置がある。
および構成がほぼ同一であることから、同一の装置で単
語と単音節が認識できるようにしたものとして単音節単
語認識装置がある。
以下、第1図を参照しながら従来の単音節単語音声認識
装置について説明する。
装置について説明する。
第1図は、単音節単語音声認識装置の従来例の構成を示
したものである。
したものである。
同図において、1は音声を電気信号に変換するマイクロ
フォン等からなる入力部、2は上記入力部1からの電気
信号をディジタル化するA/D変換部、3はA/D変換
部2でディジタル化された音声信号から周波数分析等の
手段によって音声の特徴を抽出する特徴抽出部、4は特
徴抽出部3で抽出された音声分析パタンを入力が単語か
単音節かで切換るモード切換スイッチ、6は入力された
単音節の音声分析パタンを一時的に記憶しておく単音節
用人カパタン記憶部、6は入力された単語の音声分析パ
タンを一時的に記憶しておく単語用入力パタン記憶部、
7は単音節用人カパタン記憶部5および単語用人カパタ
ン記憶部6を入力が単語か単音節かで切換るモード切換
スイッチ、10は認識対称となる被数個の単音節音声の
特徴を標準パタンとして予め記憶せしめておく単音節用
標準パタン記憶部、11は認識対称となる複数個の単語
音声の特徴を標準パタンとして予め記憶せしめておく単
語用標準パタン記憶部、8は上記入力パタン記憶部に記
憶されたパタンと上記標準パタン記憶部に記憶さnた複
数の標準パタンとの類似度を計算し、入力音声を特定の
単語あるいは単音節と認識する類似度計算部、9は上記
類似度計算部によって認識された単語あるいは単音節に
対応する信号を出力する出力部である。
フォン等からなる入力部、2は上記入力部1からの電気
信号をディジタル化するA/D変換部、3はA/D変換
部2でディジタル化された音声信号から周波数分析等の
手段によって音声の特徴を抽出する特徴抽出部、4は特
徴抽出部3で抽出された音声分析パタンを入力が単語か
単音節かで切換るモード切換スイッチ、6は入力された
単音節の音声分析パタンを一時的に記憶しておく単音節
用人カパタン記憶部、6は入力された単語の音声分析パ
タンを一時的に記憶しておく単語用入力パタン記憶部、
7は単音節用人カパタン記憶部5および単語用人カパタ
ン記憶部6を入力が単語か単音節かで切換るモード切換
スイッチ、10は認識対称となる被数個の単音節音声の
特徴を標準パタンとして予め記憶せしめておく単音節用
標準パタン記憶部、11は認識対称となる複数個の単語
音声の特徴を標準パタンとして予め記憶せしめておく単
語用標準パタン記憶部、8は上記入力パタン記憶部に記
憶されたパタンと上記標準パタン記憶部に記憶さnた複
数の標準パタンとの類似度を計算し、入力音声を特定の
単語あるいは単音節と認識する類似度計算部、9は上記
類似度計算部によって認識された単語あるいは単音節に
対応する信号を出力する出力部である。
上記のように構成された音声認識装置について、以下、
具体的に動作を説明する。
具体的に動作を説明する。
まず単音節モード時には、モード切換スイッチ4および
7をA側に接続し、入力された音声を入力部1により電
気信号に変換し、この電気信号を上記A/D 変換部2
によシディジタル化し、このディジタル化された音声信
号から上記特徴抽出部3により音声の特徴を抽出して上
記単音節用入力パタン記憶部5に一時的に入力する。次
に、上記類似度計算部8によシ、入力パタンに最も類似
していると判定された単音節用標準パタン記憶部10の
標準パタンに対応した信号が上記出力部9から出力され
る。
7をA側に接続し、入力された音声を入力部1により電
気信号に変換し、この電気信号を上記A/D 変換部2
によシディジタル化し、このディジタル化された音声信
号から上記特徴抽出部3により音声の特徴を抽出して上
記単音節用入力パタン記憶部5に一時的に入力する。次
に、上記類似度計算部8によシ、入力パタンに最も類似
していると判定された単音節用標準パタン記憶部10の
標準パタンに対応した信号が上記出力部9から出力され
る。
次に単語モード時には、モード切換スイッチ4および7
をBll!+に接続し、上記単音節モードの場合と同様
に、入力単語音声は、入力部1およびA/D変換部2お
よび特徴抽出部3によシ入カパタンに変換され、単語用
人カパタン記憶部6に一時的に格納される。この入力パ
タンは類似度計算部8により、単語用標準パタン記憶部
11の標準パタンと比較さn、最も類似していると判定
さnた標準パタンに対応した信号が出力部9から出力さ
れる。
をBll!+に接続し、上記単音節モードの場合と同様
に、入力単語音声は、入力部1およびA/D変換部2お
よび特徴抽出部3によシ入カパタンに変換され、単語用
人カパタン記憶部6に一時的に格納される。この入力パ
タンは類似度計算部8により、単語用標準パタン記憶部
11の標準パタンと比較さn、最も類似していると判定
さnた標準パタンに対応した信号が出力部9から出力さ
れる。
以上のように構成された音声認識装置では、入力パタン
記憶部が単音節用と単語用の2つが必要であシ、装置規
模が大きくなるという欠点があった。単語認識の場合、
1つの単語発生に要する時間は普通1〜3秒程度である
。これに比べて、単音節の場合は、0.2〜0.3秒程
度であるので、必要とする入力パタン記憶部の大きさは
単語と単音節で、5〜10倍程度皮肉となる。従って、
単語認識と単音節認識で入力パタン記憶部を共有したと
しても単音節認識の場合には、入力パタン記憶部が有効
に活用されないという問題があった。
記憶部が単音節用と単語用の2つが必要であシ、装置規
模が大きくなるという欠点があった。単語認識の場合、
1つの単語発生に要する時間は普通1〜3秒程度である
。これに比べて、単音節の場合は、0.2〜0.3秒程
度であるので、必要とする入力パタン記憶部の大きさは
単語と単音節で、5〜10倍程度皮肉となる。従って、
単語認識と単音節認識で入力パタン記憶部を共有したと
しても単音節認識の場合には、入力パタン記憶部が有効
に活用されないという問題があった。
発明の目的
本発明は、単音節単語音声認識装置において、上記の従
来例の問題点を除去し、入力パタン記憶部を有効に活用
することを目的とするものである。
来例の問題点を除去し、入力パタン記憶部を有効に活用
することを目的とするものである。
発明の構成
本発明は、単音節単語認、識装置において、単音節認識
時に、入カッ(タン記憶部に複数個の入カッ(タンを取
込みながら認識動作を行い、入カッ(タン記憶部を有効
に活用し、かつ高速に単音節認識を行わしめるものであ
る。
時に、入カッ(タン記憶部に複数個の入カッ(タンを取
込みながら認識動作を行い、入カッ(タン記憶部を有効
に活用し、かつ高速に単音節認識を行わしめるものであ
る。
実施例の説明
以下、本発明の実施例について図面とともに説明する。
第2図は、本発明の一実施例における単音節単語音声認
識装置の構成を示したものである。
識装置の構成を示したものである。
同図において、1は入力部、2はA/D 変換部、3は
特徴抽出部、8は類似度計算部、9は出力部1oは単音
節用標準]くタン記憶部、11は単語用標準パタン記憶
部であり、従来例と同等のものである。12は本発明に
よる入カッくタン言己憶部であるO まず、入力音声は、入力部1およびA/D 変換部2お
よび特徴抽出部iにより入力・くタンに変換される。こ
の人カッくタンは、入カッくタン舊己憶部12に格納さ
れる。入カッくタン記憶部12の大きさは、入力される
単語のうち最大長のものが格納可能な大きさに設定する
。すなわち、最長の単語の発声持続時間が3秒であると
すると入力パタン記憶部12の大きさは、3秒の入力パ
タンが格納可能な大きさに設定される。従って、入力パ
タン記憶部12に一時的に格納可能な単語数は1個であ
る。
特徴抽出部、8は類似度計算部、9は出力部1oは単音
節用標準]くタン記憶部、11は単語用標準パタン記憶
部であり、従来例と同等のものである。12は本発明に
よる入カッくタン言己憶部であるO まず、入力音声は、入力部1およびA/D 変換部2お
よび特徴抽出部iにより入力・くタンに変換される。こ
の人カッくタンは、入カッくタン舊己憶部12に格納さ
れる。入カッくタン記憶部12の大きさは、入力される
単語のうち最大長のものが格納可能な大きさに設定する
。すなわち、最長の単語の発声持続時間が3秒であると
すると入力パタン記憶部12の大きさは、3秒の入力パ
タンが格納可能な大きさに設定される。従って、入力パ
タン記憶部12に一時的に格納可能な単語数は1個であ
る。
入力パタン記憶部12に単語が格納されている様子を第
3図に示す。この入力パタン記憶部内の単語入力パタン
は、類似度計算部8により、単語用標準パタン記憶部1
1の標準パタンと比較され、最も類似していると判定さ
れた標準パタンに対応した信号が出力部9から出力され
る。次に入力パタンが単音節の場合を説明する。単語の
場合と同様に入力された単音節入力パタンは、入力パタ
ン記憶部12に格納される。単音節音声の発声持続時間
はほぼ0.3秒程度であるので、前述したように入力パ
タン記憶部12には、複数個の単音節入力パタンを格納
することが可能である。この様子を第4図に示す。第4
図においてそれぞれ、音声データ(111)〜(1,n
)、(2,1)〜(2+ ” ) t・・・・・・、(
m、1)〜(m 、 n )は単音節入力パタンを示す
。この入力パタン記憶部内の複数個の単音節入力パタン
は、類似度計算部8により、順々に単音節用標準パタン
記憶部12の標準パタンと比較され最も類似していると
判定された標準パタンに対応した信号が出力部9から出
力される。
3図に示す。この入力パタン記憶部内の単語入力パタン
は、類似度計算部8により、単語用標準パタン記憶部1
1の標準パタンと比較され、最も類似していると判定さ
れた標準パタンに対応した信号が出力部9から出力され
る。次に入力パタンが単音節の場合を説明する。単語の
場合と同様に入力された単音節入力パタンは、入力パタ
ン記憶部12に格納される。単音節音声の発声持続時間
はほぼ0.3秒程度であるので、前述したように入力パ
タン記憶部12には、複数個の単音節入力パタンを格納
することが可能である。この様子を第4図に示す。第4
図においてそれぞれ、音声データ(111)〜(1,n
)、(2,1)〜(2+ ” ) t・・・・・・、(
m、1)〜(m 、 n )は単音節入力パタンを示す
。この入力パタン記憶部内の複数個の単音節入力パタン
は、類似度計算部8により、順々に単音節用標準パタン
記憶部12の標準パタンと比較され最も類似していると
判定された標準パタンに対応した信号が出力部9から出
力される。
以上の説明のように、単音節の場合、複数個の入力パタ
ンを格納出来るので、単一の入力パタンを格納する場合
に比べて、高速に音声を入力し認識することができる。
ンを格納出来るので、単一の入力パタンを格納する場合
に比べて、高速に音声を入力し認識することができる。
すなわち、第6図に示すように音声を取込みながら類似
度計算が行えるわけである。また、類似度計算時に再照
合等の複雑な認識動作を行う場合入力パタンの長時間の
保持が必要となるわけであるが、このような手法を用い
る場合にも本発明によれば容易に対処が可能である。
度計算が行えるわけである。また、類似度計算時に再照
合等の複雑な認識動作を行う場合入力パタンの長時間の
保持が必要となるわけであるが、このような手法を用い
る場合にも本発明によれば容易に対処が可能である。
以上のように本実施例によれば、単音節単語認識におい
て入力パタン記憶部12を設けることにより、第4図に
示すような単音節音声入力パタンの取込みが出来る。す
なわち、入力パタン記憶部を有効に活用でき、また単音
節認識時には、高速に認識が行える。
て入力パタン記憶部12を設けることにより、第4図に
示すような単音節音声入力パタンの取込みが出来る。す
なわち、入力パタン記憶部を有効に活用でき、また単音
節認識時には、高速に認識が行える。
発明の効果
以上のように本発明は、単音節単語認識装置において、
入力パタン記憶部を設け、単音節と単語の場合で入力パ
タンを共通領域に取シ込み、かつ、単音節の場合には複
数個の入力パタンを格納することができるようにして、
従来例に比べて、入力パタン記憶部を有効に活用し、単
音節入力時には高速の入力、認識を可能にするものであ
る。
入力パタン記憶部を設け、単音節と単語の場合で入力パ
タンを共通領域に取シ込み、かつ、単音節の場合には複
数個の入力パタンを格納することができるようにして、
従来例に比べて、入力パタン記憶部を有効に活用し、単
音節入力時には高速の入力、認識を可能にするものであ
る。
また、単音節入力時は、入力パタンを長時間保持できる
ので、従来例に比べて複雑な認識アルゴリズムを導入す
ることも可能であり、その実用的効果は犬なるものがあ
る。
ので、従来例に比べて複雑な認識アルゴリズムを導入す
ることも可能であり、その実用的効果は犬なるものがあ
る。
第1図は、従来の単音節単語音声認識装置のブロック図
、第2図は本発明における一実施例の単音節単語音声認
識装置のブロック図、第3図は同実施例における入力パ
タン記憶部の単語入力パタン格納の様子を示す図、第4
図は同実施例における入力パタン記憶部の単音節入力パ
タン格納の様子を示す図、第5図は同実施例の単音節単
語認識装置の単音節認識時の動作を示すタイムチャート
図である。 1・・・・・・入力部、2・・・・・・A/D変換部、
3・・・・・・特徴抽出部、8・・・・・・類似度計算
部、9・・・・・・出力部、1o・・・・・・単音節用
標準パタン記憶部、11・・・・・・単語用標準パタン
記憶部、12・・・・・・入力パタン記憶部・ 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 入カイ言!(単語J 第4図 5図 吟関
、第2図は本発明における一実施例の単音節単語音声認
識装置のブロック図、第3図は同実施例における入力パ
タン記憶部の単語入力パタン格納の様子を示す図、第4
図は同実施例における入力パタン記憶部の単音節入力パ
タン格納の様子を示す図、第5図は同実施例の単音節単
語認識装置の単音節認識時の動作を示すタイムチャート
図である。 1・・・・・・入力部、2・・・・・・A/D変換部、
3・・・・・・特徴抽出部、8・・・・・・類似度計算
部、9・・・・・・出力部、1o・・・・・・単音節用
標準パタン記憶部、11・・・・・・単語用標準パタン
記憶部、12・・・・・・入力パタン記憶部・ 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 入カイ言!(単語J 第4図 5図 吟関
Claims (1)
- 音響−電気変換を行う音声入力部と、アナログ信号をデ
ィジタル化するA/D変換部と、ディジタル化された音
声信号の特徴を抽出する特徴抽出部と、単語に対しては
一つの入力パタンを格納し、単音節に対しては複数個の
入力パタンを格納する入力パタン記憶部と、あらかじめ
いくつかの単語の標準パタンを記憶しておく単語用標準
パタン記憶部と、あらかじめいくつかの単音節の標準パ
タンを記憶しておく単音節用標準パタン記憶部と、上記
入力パタン記憶部に格納された単音節あるいは単語の入
力パタンと上記単音節用あるいは単語用標準パタン記憶
部の記憶している標準パタンとを比較し、類似度の高い
パタンを選択する類似度計算部とを具備した単音節単語
認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16181784A JPS6141198A (ja) | 1984-08-01 | 1984-08-01 | 単音節単語認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16181784A JPS6141198A (ja) | 1984-08-01 | 1984-08-01 | 単音節単語認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6141198A true JPS6141198A (ja) | 1986-02-27 |
Family
ID=15742469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16181784A Pending JPS6141198A (ja) | 1984-08-01 | 1984-08-01 | 単音節単語認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6141198A (ja) |
-
1984
- 1984-08-01 JP JP16181784A patent/JPS6141198A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2662120B2 (ja) | 音声認識装置および音声認識用処理ユニット | |
JPS58130393A (ja) | 音声認識装置 | |
JPS6141198A (ja) | 単音節単語認識装置 | |
JP2002229592A (ja) | 音声認識装置 | |
JPS59195300A (ja) | 音声認識装置 | |
JPS638798A (ja) | 音声認識装置 | |
JPH0194398A (ja) | 音声標準パターンの作成方法 | |
JP2555029B2 (ja) | 音声認識装置 | |
JPS62115498A (ja) | 無声破裂子音識別方式 | |
JPS61121090A (ja) | 音声認識装置 | |
JPS63221396A (ja) | 母音区間検出方式 | |
JPS61183699A (ja) | 音声認識装置 | |
JPS62164097A (ja) | 音声判別方式 | |
JPS63125998A (ja) | 音声入出力装置 | |
JPS63292196A (ja) | 特定話者用音声認識装置 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
JPS58195893A (ja) | 音声認識装置における前処理方法 | |
JPS59155900A (ja) | 音声認識装置 | |
JPS6211898A (ja) | 音声認識装置 | |
JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
JPS59211098A (ja) | 音声認識装置 | |
JPS62102296A (ja) | 音声編集装置 | |
JPS60188998A (ja) | 音声認識装置 | |
JPS5944640B2 (ja) | 音声情報サンプリング装置 | |
JPS5957298A (ja) | 音声入力方式 |