JPS6131480B2 - - Google Patents

Info

Publication number
JPS6131480B2
JPS6131480B2 JP9729080A JP9729080A JPS6131480B2 JP S6131480 B2 JPS6131480 B2 JP S6131480B2 JP 9729080 A JP9729080 A JP 9729080A JP 9729080 A JP9729080 A JP 9729080A JP S6131480 B2 JPS6131480 B2 JP S6131480B2
Authority
JP
Japan
Prior art keywords
output
level
vowel
shift register
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP9729080A
Other languages
English (en)
Other versions
JPS5722298A (en
Inventor
Hiroshi Itoyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP9729080A priority Critical patent/JPS5722298A/ja
Publication of JPS5722298A publication Critical patent/JPS5722298A/ja
Publication of JPS6131480B2 publication Critical patent/JPS6131480B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声認識装置の音響処理回路に関する
もので、第1の目的とするところは音声の分析、
特徴抽出を簡単に行ない、しかも、母音の定常信
号を取り出すことによつて調音結合の影響を除去
して特徴量パターン変換精度を向上させ、更に、
音声の特徴量の表現情報を少ない量で表現し識
別、判断処理を簡単にすることにあり、第2の目
的とするところは、CPUにおけるパターンマツ
チング処理を簡単かつ短時間に行なうことにあ
る。
一般に、音声認識装置は、第1図のように、マ
イク1により音声入力を電気信号に変換し、この
電気信号を増巾器2で増巾し音響処理回路3に入
力し、音響処理回路3の内容をCPU4に取り込
み、メモリ5に記憶された登録単語とのパターン
マツチングを行ない、音声を認識するように構成
している。
ところで従来の音声認識装置においては、多数
の単語を認識するために音響処理回路の構成は、
音響分析、特徴抽出、パターン変換のプロセスを
とつており、構成が複雑であるという欠点を有し
ていた。
本発明はかかる点に鑑みてなされたもので、少
数の特定語彙を特定話者が話すのを認識するよう
にし、音響分析と特徴抽出とを一体とし、母音の
第1、第2フオルマント周波数を抽出することで
これを実現したものであり、以下実施例により詳
細に設明する。
第2図は本発明に係る音響処理回路の一実施例
のブロツク回路図で、1はマイクであり、音声入
力を電気信号に変換するもので、この電気信号を
増巾器2で増巾する。6はフイルタバンクで、増
巾器2からの信号を周波数分割して取り込むもの
で、このフイルタバンク6は10個のフイルタ6
〜610よりなり、各フイルタ6〜610は母音
a,i,u,e,oの第1フオルマントおよび第
2フオルマントを抽出するように中心周波数と帯
域巾を選定できるよう外部から調整可能となつて
いる。7は10個のローパスフイルタ7aよりなる
ローパスフイルタで、各ローパスフイルタ7aは
フイルタバンク6の各フイルタ6〜610の出力
をそれぞれ平滑するものである。8はローパスフ
イルタ7aの出力を時系列信号に変換するマルチ
プレクサ、9は増巾器2の出力信号のレベルを検
出するレベルデイテクタである。10はレベルノ
ーマライザで、マルチプレクサ8の出力信号をレ
ベルデイテクタ9の出力信号で振巾正規化するも
のである。11はしきい値回路で、レベルノーマ
ライザ10の出力信号レベルを2値レベルの時系
列信号よりなる音韻データに変換するものであ
る。12,13,14はそれぞれ音韻データを取
り込む第1乃至第3のシフトレジスタ(10ビツ
ト)、15は一致検出回路、16はフリツプフロ
ツプである。17はデータ変換回路であり、比較
回路18とラツチ付シフトレジスタ19と、アド
レスカウンタ20とROMよりなる母音メモリ2
1とで構成され、第3のシフトレジスタ14の音
韻データを3ビツトのラベルデータに変換する。
フイルタバンク6の各フイルタ6〜610の中
心周波数と帯域巾は、第4図に示す母音の周波数
を抽出できるようにしておき、これにより単語音
声が入力されたとき、ローパスフイルタ7aの出
力には母音の周波数に対応する包絡信号が発生す
る。例えば、「WATASI」の単語音声が入力され
たとき、母音「AAI」に対応するフイル
タ周波数「f11、f12、f11f12、f12f22」を有するフイ
ルタ6,6,6,6,6,6の出力
を平滑するローパスフイルタ7aの出力として第
5図のような包絡信号が発生する。(「」は母音
以外の音すなわち子音を表わす)この信号をアナ
ログのマルチプレクサ8により時系列信号に変換
する。このとき、マルチプレクサ8のスキヤンの
周期は音声の準定常状態と考えられる20〜30m
sec以内で行なう。この周期は短かい程定常性が
保たれるが、情報の圧縮率より制限があり、30m
sec以内で可変できるようにしておく。この時系
列信号は、レベルデイテクタ9の信号で入力音声
の振巾変化を正規化するレベルノーマライザ10
により正規化され、しきい値回路11に入力され
る。このしきい値回路11は、信号の一定レベル
をしきい値にして2値信号に変換する。したがつ
て、前述の例では、「f11f12、f11f12、f21f22」のフ
イルタ周波数をもつフイルタ6,6,6
,6,6の出力に対応するマルチプレク
サ8からの時系列信号がHレベルとして検出さ
れ、その他はLレベルになり、しきい値回路11
の出力は母音のフオルマント周波数に対応した時
系列信号上の位置にHレベルの値をもつ2値レベ
ルの時系列信号よりなる音韻データに変換される
ことになる。ここで、スキヤン時間を100μsec、
スキヤン周期を20msecとすると、母音「A」に
ついては第6図aのような信号が発生し、母音
「I」については第6図bのような信号が発生す
る。ここで、第1のシフトレジスタ12のシフト
クロツクをマルチプレクサ8のスキヤンクロツク
と同じ信号を使用すれば、音韻データは第1のシ
フトレジスタ12に取り込まれる。即ち、単語
「WATASI」が発声されマルチプレクサ8の周期
を音声の準定常状態と考えて20msec(20msecを
1フレームと呼ぶ)とすると、しきい値回路11
の出力には母音は定常的、子音は過渡的であるこ
とを考えると、母音は数フレーム続くと考えられ
ることより、「AAAAAAIII」(Aあるいは
I1個が1フレームで、AあるいはIの音韻データ
の2値信号レベルは第6図a,bに示す通りであ
る)の各音韻データが1フレーム(20msec)の
1スキヤン時間(100μsec)に順次第1のシフト
レジスタ12に取り込まれることになる。このよ
うにして第1のシフトレジスタ12には20msec
おきに100μsec期間だけ音韻データが取り込ま
れ、つぎの20msecにはつぎの音韻データを取り
込むとともに前に取り込んだ音韻データを第2の
シフトレジスタ13に送り込み、同時に第3のシ
フトレジスタ14にも送り込む。このとき、一致
検出回路15は第1のシフトレジスタ12と第2
のシフトレジスタ13の音韻データの一致を取る
回路で、一致結果によりフリツプフロツプ16を
Hレベル又はLレベルにする。この信号がHレベ
ルのとき第3のシフトレジスタ14の音韻データ
はクリヤされ、Lレベルのときはクリヤされな
い。
上述の動作を第7図により説明する。第7図
で、nは20msecに1回の第1シフトレジスタ1
2への音韻データの取り込み時間を表わすものと
する。まず「WATASI」と発声されると、音韻
データが「AAAAAAIII」で第1のシフト
レジスタ12に入力される。このとき、n=1…
…12と第1乃至第3のシフトレジスタ12,1
3,14の音韻データは変化する。同時に、一致
検出回路15ではn−1時点の第1のシフトレジ
スタ12の音韻データと、n−2時点の第2のシ
フトレジスタ13の音韻データが比較され、一致
すればLレベル、不一致ではHレベルの信号を出
し、Hレベルで第3のシフトレジスタ14の音韻
データをクリヤする。これよりn=1………12で
第3のシフトレジスタ14の音韻データは第7図
の右端のブロツクの音韻データとなる。このよう
に、nフレームとn−1フレームとの音韻データ
を比較し、一致したときのみ第3のシフトレジス
タ14の内容とすることにより母音の定常状態の
みを検出でき、フイルタバンク6の各フイルタ6
〜610の中心周波数の設定時に定常母音で設定
しても単語発声時に子音から母音へのわたり、又
は従続音の影響による歪みを受けたフレームは母
音と判別せず、定常母音に近いフレームのみを母
音と判別することで、発声単語の特徴量の抽出精
度が向上できる。この第3のシフトレジスタ14
の音韻データはデータ変換回路17の比較回路1
8に送られる。ここで母音メモリ21のアドレス
カウンタ20がフリツプフロツプ16の信号によ
り起動され、母音メモリ21から読み出された母
音の音韻データと第3のシフトレジスタ14から
送られた音韻データとが比較回路18で逐次比較
される。このとき母音メモリ21から同時に読み
出された各母音に対応する3ビツトのラベルデー
タはラツチ付シフトレジスタ19にラツチされ、
比較回路18から一致信号が出力されることによ
りCPU4に送り込まれることになる。なお第8
図は母音メモリの記憶例を示すものである。この
ようにして10ビツトの時系列信号よりなる音韻デ
ータはデータ変換回路17にて3ビツトの時系列
信号よりなるラベルデータにビツト圧縮されて
CPU4に取り込まれることになり、CPU4によ
りメモリ5に記憶した登録単語とパターンマツチ
ングが行なわれる。このときパターンのもつ意味
は「」「母音」の配列と「母音」の種類(a,
i,u,e,o,)の配列であり、実施例にあつ
ては母音の種類の配列は3ビツトのラベルデータ
であるので、10ビツトの母音の音韻データにてパ
ターンマツチングする場合に比較してCPU4に
おけるパターンマツチング処理が簡単かつ短時間
で行なうことができる。
本発明は上述のように構成されており、音声入
力の母音の第1フオルマントおよび第2フオルマ
ントを抽出するように中心周波数と帯域巾を有す
るフイルタを設けたことにより音声の分析、特徴
抽出が簡単にでき、又、第1乃至第3のシフトレ
ジスタによりnフレームとn−1フレームとの一
致より母音の定常信号を取り出すことで調音結合
の影響を除去でき、特徴量のパターン変換精度を
向上でき、しかも、音声の特徴量の表現情報を少
ない量で表現することで識別し、判断処理が簡単
にでき、更に、CPUにおけるパターンマツチン
グ処理が簡単かつ短時間で行なうことができると
いう利点を有する。
【図面の簡単な説明】
第1図は音声認識装置の基本回路図、第2図は
本発明の一実施例の回路図、第3図は同上の要部
回路図、第4図は同上の動作原理図、第5図は同
上の特性図、第6図a,bは同上のしきい値回路
の出力波形図、第7図は同上の動作説明図、第8
図は同上の母音メモリの記憶例を示す図である。 1はマイク、2は増巾器、4はCPU、5はメ
モリ、6〜610はフイルタ、7aはローパスフ
イルタ、8はマルチプレクサ、9はレベルデイテ
クタ、10はレベルノーマライザ、11はしきい
値回路、12,13,14はシフトレジスタ、1
5は一致検出回路、16はフリツプフロツプ、1
7はデータ変換回路、21は母音メモリである。

Claims (1)

    【特許請求の範囲】
  1. 1 音声入力をマイクにより変換した電気信号を
    増巾し、メモリに記憶した登録単語とCPUによ
    りパターンマツチングする音声認識装置の音響処
    理回路において、電気信号から母音の第1フオル
    マントおよび第2フオルマントを抽出する中心周
    波数と帯域巾を有する10個のフイルタと、各フイ
    ルタの出力をそれぞれ平滑するローパスフイルタ
    と、各ローパスフイルタの出力を時系列信号に変
    換するマルチプレクサと、前記電気信号のレベル
    を検出するレベルデイテクタと、マルチプレクサ
    の出力をレベルデイテクタの出力で振巾正規化す
    るレベルノーマライザと、レベルノーマライザの
    出力を2値信号に変換するしきい値回路と、しき
    い値回路から出力される10ビツトの時系列信号よ
    りなる音韻データを順次取り込む第1のシフトレ
    ジスタと、第1のシフトレジスタの音韻データを
    順次遅れて取り込む第2および第3のシフトレジ
    スタと、第1および第2のシフトレジスタの音韻
    データを比較し不一致のときHレベルの出力を出
    す一致検出回路と、一致検出回路の出力により動
    作し第3のシフトレジスタの音韻データをクリヤ
    するようにしたフリツプフロツプと、第3のシフ
    トレジスタの音韻データを母音メモリから読み出
    された母音の音韻データと比較して一致した母音
    に対応する3ビツトのラベルデータを出力するデ
    ータ変換回路とを具備し、前記ラベルデータを
    CPUに入力するようにしたことを特徴とする音
    声認識装置の音響処理回路。
JP9729080A 1980-07-15 1980-07-15 Acoustic processing circuit for voice recognizing device Granted JPS5722298A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9729080A JPS5722298A (en) 1980-07-15 1980-07-15 Acoustic processing circuit for voice recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9729080A JPS5722298A (en) 1980-07-15 1980-07-15 Acoustic processing circuit for voice recognizing device

Publications (2)

Publication Number Publication Date
JPS5722298A JPS5722298A (en) 1982-02-05
JPS6131480B2 true JPS6131480B2 (ja) 1986-07-21

Family

ID=14188364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9729080A Granted JPS5722298A (en) 1980-07-15 1980-07-15 Acoustic processing circuit for voice recognizing device

Country Status (1)

Country Link
JP (1) JPS5722298A (ja)

Also Published As

Publication number Publication date
JPS5722298A (en) 1982-02-05

Similar Documents

Publication Publication Date Title
KR910002198B1 (ko) 음성인식방법과 그 장치
EP0077194B1 (en) Speech recognition system
JPS6247320B2 (ja)
JPS6138479B2 (ja)
JPS6131480B2 (ja)
JP2813209B2 (ja) 大語彙音声認識装置
JPH04324499A (ja) 音声認識装置
JPH02124600A (ja) 音声認識装置
JPH0441357B2 (ja)
JPS63213899A (ja) 話者照合方式
JPH0552509B2 (ja)
KR920002861B1 (ko) Lpc 음성합성장치 및 그 방법
JP2891259B2 (ja) 音声区間検出装置
JPS6227798A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPH09198382A (ja) 音声入力かな漢字変換装置
JPS61281298A (ja) 音声認識装置
JPS63303395A (ja) マルチ増幅機能を備えた音声認識装置
Webb et al. A MICROCOMPUTER BASED SPEECH RECOGNITION SYSTEM
JPS6120099A (ja) 音韻セグメンテ−シヨン装置
JPH06324697A (ja) 音声認識システム
JPS59124392A (ja) 音声認識方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPH0887292A (ja) 単語音声認識装置
JPS6086600A (ja) 音声認識方法