JPS61281298A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61281298A
JPS61281298A JP60107764A JP10776485A JPS61281298A JP S61281298 A JPS61281298 A JP S61281298A JP 60107764 A JP60107764 A JP 60107764A JP 10776485 A JP10776485 A JP 10776485A JP S61281298 A JPS61281298 A JP S61281298A
Authority
JP
Japan
Prior art keywords
input
pattern
speech
buffer
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60107764A
Other languages
English (en)
Inventor
宏樹 大西
正幸 飯田
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP60107764A priority Critical patent/JPS61281298A/ja
Publication of JPS61281298A publication Critical patent/JPS61281298A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は音声認識装置に関し、特に連続的に入力さtま
た音声を認識する事のできる音声認識装置に関する。
(ロ) 従来の技術 近年、音声認識技術に関する研究が活発になっておシ、
1982年1月28日発行の日経エレクトロニクスの記
事「文章や大語集を対象とした音声認識の研究が活発化
」K示されているように、各種の音声認識装置が開発さ
れ、実用化されつつある。
第5図に一般的な音声認識技術の構成を示す。
同図の音声認識装置は、マイクロフォン(1)、音声分
析部(2+、バラメータバッファ(3)、パターン作成
部(4)、パターンバッファ(5)、及びパターン認識
部(胆とからなり、マイクロフォン(1)から得られる
例えば基本単位としての単音節毎の音声信号を音声分析
部(2)にて分析し゛て例えば周波数スペクトル値の如
き特徴パラメータ時系列を得て、パラメータバッフ1(
3)に貯える。この1単位を構成する例えば100サン
プル程度の特徴パラメータ時系列をパターン作成部(4
)にて特定数例えば16サンプルに正規化する事に依シ
、入力音声パターンを得てバルーンバラ7y(5)に貯
える。そしてこの場合、パターン認識部ωの参照パター
ンメモリ曽には標準的な各単音節の参照パターンが格納
されておフ、該パターン認識部mの比較処理部のυはこ
れ等各参照パターンと上記パターンバッフ1(5)の入
力音声パターンとを比較し、最も誤差の小さい即ち類似
度の高い参照パターンを見い出す事に依シこの時の入力
音声を認識するのである。
この様に、音声認識装置に於いては、音声分析部(2)
での分析処理、パターン作成部(4)での正規化処理、
パターン認識部■でのパターン認識処理に大別され、従
来の斯る装置では、第6図の処理過程図に示す如く′、
例えば、「あ」 「さ」「ひ」なる単音節列を音声認識
させる場合、先ず「あ」の入力に対しての分析処理、無
音検出による入力終了検知、正規化処理、パターン認識
処理、及び認識結果の出力が順次完了した後に、次の「
さ」の入力に対応でき、又、この「さ」の処理が順次完
了した後に、「ひ」の入力に対応できる事となる。
而して、上述の各処理の内、パターン認識部間でのパタ
ーン認識処理としては、認識率の向上の為に通常ダイナ
ミックプロゲラ嵩ミング(一般にDrと称す)の手法を
用いたパターンマツチングが行なわれるので、この処理
演算量が大きくなシ、この為の処理時間も長くなる。従
って、第5図の如き従来装置では、第6図の如く、各音
声の入力の毎に%各動作を時間的に直列処理していたの
で、「あ」の入力の後、次の「さ」の入力を開七台する
までの待ち時間が、長くなり、「あ」 「さ」 「ひ」
なる各音声の発声と発声の間の無音区間を長くとる事が
必要となるので、スムーズな音声入力ができず、斯る装
置の操作性の低下を来たす欠点があった。
そこで、斯る欠点を解消する為には、各処理部(2)、
(4)、輸の動作を司どるプロセッサとして高速のもの
を採用しl)、特開昭58−192096号公報並びに
特開昭58−224395号公報に示されている如く、
各処理部(2)、(4)、鴎を複数のプロセッサにて分
担させて並列処理する様にすればよいが、いずれの場合
でも構成が複雑になったシ、コスト高を招く新たな問題
が生じる事となる。
又、これとは異なる対策としては、第7図に示す如く、
第5図のパラメータバッフy (31を増設した第1乃
至第nパラメータバッフy(lυ〜(3n)からなるパ
ラメータバッフ1メモリ回路■を備えた音声認識装置が
実現可能である。同図の装置の処理動作は、第8図に示
す如く、「あ」 「さ」 「ひ」の一連の単音声を認識
させる場合、音声分析部(2)は、「あ」の分析処理の
後、直ちK「さ」の分析処理が行なえ、そして次に直ち
K「ひ」の分析処理が行なえるのである。これ等の処理
結果である各特徴パラメータ時系列は、パラメータバッ
フ1メモリ回路頭の各入力スイッチPi、P2、P3の
閉成動作により、夫々順次第1、第2、第6バラ°メー
タバツフyc31)、(支)、C(3)K格納されてお
シ、これら一連の単音声の入力が終了した後で、パラメ
ータバララフメモリ回路■の各出力スイッチQ1、Q2
、Q3、の閉成動作にょフ、先ず第1パラメータバツフ
yc111の「あ」の特徴パラメータ時系列がパターン
作成部(4)に導入されて、ここで正規化処理された後
パターン認識部+601 Kでパターン認識処理され、
その認識結果が出力される。
そしてこの後直ちに第2パラメータバツフyC@の「さ
」Kついての同様の処理がなされ、その後さらに第3パ
ラメータバッファ国の「ひ」についての同様の処理がな
される。
斯様な装置に於いては、「あ」 「さ」 「ひ」なる一
連の単音節の入力分析処理のみを先に行なった後で、処
理時間の長いパーターン認識処理を各単音節について実
行できるので、各単音節の発声と発声との間の待ち時間
が短かくて済み話者にとってはスムーズで自沿:な発声
が可能であるが、以下の如き新たな欠点が生じる事とな
る。即ち、パラメータ3771回路(1)に複数個貯え
られる特徴パラメータ時系列は各°単語毎K例えばサン
プリング周波数が5mgICの場合100サンプル程度
にも及ぶので、パラメータバッファ回路嬢全体のメモリ
容量が大巾に増大し、構成の複雑化やコスト高を招く慣
れがあった。
e→ 発明が解決しようとする問題点 本発明は上述の点に鑑みてなされ、一連の基本音声を連
続的にスムーズに入力でき、しかもメモリ容量の大巾な
増加を超〈事のない音声認識装置を提供するものである
に)問題点を解決する為の手段 本発明の音声認識装置は、入力された基本単位毎の音声
を分析して特徴パラメータ時系列を基本単位毎に抽出す
る音声分析部、該音声分析部からの基本単位毎の特徴パ
ラメータ時系列を夫々特定サンプル数に正規化して複数
の入力基本音声パターンを順次得るパターン作成部、該
パターン作成部から順次得られる複数の入力基本音声パ
ターンを同時に格納可能なバッフ1メモリ、該バッフ1
メそりから格納順に順次読み出される入力基本音声パタ
ーンを順次認識処理するパターン認識部とからなる。
快)作 用 本発明の音声認識装置によれば、連続的に入力される各
基本単位の入力音声に対して、夫々の入力基本音声パタ
ーンの段階で、これ等一連の入力基本音声パターンが全
てバッフ1メそりに貯えられ+i、このバッフ1メモリ
の各入力基本音声パターンに対して順次認識処理を施す
事となる。
(へ)実施例 第1図に本発明の音声認識装置の構成を示す。
同図に於いて、(1)、(2)、(3)、(4)、田は
第5図の従来装置と同様にマイクロフォン、音声分析部
、パラメータバッフ1メモリ、パターン作成部、パター
ン認識部を示しており、本実施例装置が第5図の従来装
置と異なる所は、パターンバッフ7(51を増設した第
1乃至第nパターンバッファ(511〜(5n)からな
るパターンバッフ1メモリ回路[株]を備えた点ICあ
る。
又、同図の本発明実施例装置が第7図の装置と異なる所
は、複数の基本音声のデータ量の大きな特徴パラメータ
時系列の格納が可能なパラメータバッフ1メそり回路缶
を設ける代シに複数の基本音声のデータ量の小さな入力
基本音声パターンを斯様な本発明装置の動作を第2図の
処理過程図に基づいて次に説明する。例えば「あ」 「
さ」 「ひ」なる一連の単音節列を認識させる場合、話
者は各音声間に区切りをつける程度の連続発声を行なう
。これ等の音声はマイクロフォン(1)から音声分析部
(2)に入力され、該分析部(2)で先ず「あ」の音声
の入力時間中(約300m5[lC)に実時間で周波数
スペクトル値の如き特徴バラメータ時系列(サンプリン
グ周期3m5ec)を抽出しつつ、これをパラメータバ
ッフ1(3)に貯える。そして、「あ」の音声入力が終
了した時の区切り期間(約100m5ec)、即ち無音
期間を検出した時に特徴パラメータ時系列のパラメータ
バッフ 7 (31への格納を中止するのである。その
後、直ちにパラメータバッフy(31の「あ」なる特徴
パラメータ時系列はパターン作成部(4)にて正規化処
理(約10m5EC)されて入カバターンを得、この入
カバターンがパターンバッファメモリ回路団の入力スイ
ッチR1が閉成された第1パターンバツフy(51)に
格納される。
このように区切り期間に対して、その1/10程度の時
間で完了する正規化処理期間を原えただけの短かい待ち
時間を置いて、直ちに次の「さ」の音声入力が可能とな
り、この「さ」についても「あ」と同様に処理してその
入カバターンがパターンバッフ1メモリ回路■の入力ス
イッチR2が閉成すれた第2パターンバツフ1@に格納
され、続いて、同様に「ひ」の入カバターンがパターン
バッフ1メそり回路ωの入力スイッチR3が閉成された
第6パターンパツ71−[株]に格納されるのである。
h\ 斯様にして一連の入力バターへ全てパターンバッフ1メ
モリ回路印の各バッフ1(5℃、(支)、[有]に格納
された後、先ず該回路[株]の出力スイッチ81が閉成
された第1パターンバツフア(5Dから「あ」の入カバ
ターンがパターン認識部flK導入され、従来装置と同
様にパターン認識されその認識結果が出力され、続いて
、同様にパターンバッフ1メモリ回路団の第2、第6パ
ツ7y(52)(53)の「さ」 「ひ」の入カバター
ンに対して順次、認識、出力が行なわれるのである。
上述の本発明装置の各処理の動作タイミングは、上記音
声分析部(2)での分析処理にともなう第3図に示す如
き音声領域検知手段にて得られる第4図図示の各信号か
ら作り出されるのであり、以下にこれ等図に基づいて錘
子4該手段を詳述する。
第3図の音声区間検出回路(7)は、第4図(a)に示
す如き「あ」 「さ」 「ひ」なる入力音声の音声パワ
ーVをしきい値vthと比較し、第4図(b)の如きv
>v t hの音声区間信号が出力される。該音声区間
信号は立上シ検出回路(8)と、第1の無音タイマ(9
)と、第2の無音タイマααとに入力される。
第1の無音タイマ(9)は第4図(d)に示す如く音声
区間信号の立下り時点からT1=1QQmsecをカウ
ントした終端検出信号El、E2、R3を出力すると共
に、音声区間信号の立上り時点を検出する立上シ検出回
路(8)にリセットをかけて立上フ検出回路(8)か′
ら第4図(b)に示す如き始端検出信号R1、R2、I
i3を得る。又、第2の無音タイマ(101は第4図(
e)に示す如く音声区間信号の立下)時点からT1=1
%をカウントした入力終了検出信号Fを出力する。
従って、第2図の処理過程図に付記したように、最初の
「あ」の音声については、信号R1が発生した時点で、
音声分析部(2)が動作し、次の信号E1が発生した時
点で、この動作が停止してパターン作成部(4)が動作
すると共に、パターンバッフ7メモリ回路ωの入力スイ
ッチR1が閉成制御されるのである。そして次に信号H
2が発生した時点で、この入力スイッチR1が開成制御
されると共に次の「さ」の音声についての同様の処理が
なされ、又次の「ひ」の音声についても同じであシ、信
号Fの発生時点でこれ等「あ」 「さ」 「ひ」の入カ
バターンが順次各バッフy(511□□□綴に格納し終
えた事となシ、この後、各バッフ1の出方スイッチ81
.82、S3が順次閉開成され順次パターン認識される
(ト)発明の効果 本発明の音声認識装置によれば、連続的に入力される各
基本単位の入力音声に対して、夫々の入力基本音声パタ
ーンの段階で、これ等一連の入力基本音声パターンが全
てバッフ1メ七すに貯えられた後、このバッフ1メモリ
の各入力基本音声パターンに対して順次認識処理を施す
事となるので、基本音声の発声と発声の間の待ち時間が
ほとんどなくなり、スムーズな連続音声入力が可能とな
るばかりか・データ量の小さな入力基本音声パターンの
段階でバッフ1に格納できるのでメモリ容量の大巾な増
加はない。従って、斯る装置の構成の複雑化やコスト高
を招く事なく、しかも高速のプロセッサを必要とせず話
者に負担をかけない音声認識装置が実現できる。
【図面の簡単な説明】
°      第1図は本発明の一実施例の構成を示す
ブロック図、第2図は第1図の本発明装置の動作を示す
処理過程図、第3図は本発明装置に用いられる音声領域
検知部のブロック図、第4図は第3図ブロック図の信号
波形図、第5図及び第6図は従来装置のブロック図及び
処理過程図、第7図及び第8図は従来装置の改良型のブ
ロック図及び処理過程図である。 (1)・・・・・・マイクロフォン、’(2)・・・・
・・音声分析部、(3)・・・・・・バラメータバッフ
y、(4)・・・・・・パターン作成部、ω・・・・・
・パターンバッフ1メモリ回路、■・・・・・・認識処
理部。

Claims (1)

    【特許請求の範囲】
  1. (1)入力された基本単位毎の音声を分析して特徴パラ
    メータ時系列を基本単位毎に抽出する音声分析部、該音
    声分析部からの基本単位毎の特徴パラメータ時系列を夫
    々特定サンプル数に正規化して複数の入力基本音声パタ
    ーンを順次得るパターン作成部、該パターン作成部から
    順次得られる複数の入力基本音声パターンを同時に格納
    可能なバッファメモリ、該バッファメモリから格納順に
    順次読み出される入力基本音声パターンを順次認識処理
    するパターン認識部とからなる事を特徴とした音声認識
    装置。
JP60107764A 1985-05-20 1985-05-20 音声認識装置 Pending JPS61281298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60107764A JPS61281298A (ja) 1985-05-20 1985-05-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60107764A JPS61281298A (ja) 1985-05-20 1985-05-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61281298A true JPS61281298A (ja) 1986-12-11

Family

ID=14467401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60107764A Pending JPS61281298A (ja) 1985-05-20 1985-05-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61281298A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257499A (ja) * 1990-03-08 1991-11-15 Matsushita Electric Ind Co Ltd 文字データ入力装置
JP2006337970A (ja) * 2005-06-02 2006-12-14 Tetsuo Mizumoto 音声入力自動化パソコン

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5748798A (en) * 1980-09-08 1982-03-20 Mitsubishi Electric Corp Word voice recognizing device
JPS57178299A (en) * 1981-04-27 1982-11-02 Kyosan Electric Mfg Recognition pattern preparation system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5748798A (en) * 1980-09-08 1982-03-20 Mitsubishi Electric Corp Word voice recognizing device
JPS57178299A (en) * 1981-04-27 1982-11-02 Kyosan Electric Mfg Recognition pattern preparation system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03257499A (ja) * 1990-03-08 1991-11-15 Matsushita Electric Ind Co Ltd 文字データ入力装置
JP2006337970A (ja) * 2005-06-02 2006-12-14 Tetsuo Mizumoto 音声入力自動化パソコン

Similar Documents

Publication Publication Date Title
JPH0361959B2 (ja)
JPS58130393A (ja) 音声認識装置
JPS5972496A (ja) 単音識別装置
JPS6247320B2 (ja)
JP2996019B2 (ja) 音声認識装置
JPS6138479B2 (ja)
JPS61281298A (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
JPS60164800A (ja) 音声認識装置
JP2529207B2 (ja) 音韻認識装置
JPS58195895A (ja) 単語音声認識装置
JPS6312000A (ja) 音声認識装置
JPS6033599A (ja) 音声認識装置
JPS6225796A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS62111295A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS6286398A (ja) 単語音声認識装置
JPS6131480B2 (ja)
JPH09198078A (ja) 音声認識装置
JPS607493A (ja) 単音節音声認識方式
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPS6225797A (ja) 音声認識装置
JPS58223194A (ja) 日本語音声入力方式