JPS6070496A - 音声認識処理方式 - Google Patents

音声認識処理方式

Info

Publication number
JPS6070496A
JPS6070496A JP58180010A JP18001083A JPS6070496A JP S6070496 A JPS6070496 A JP S6070496A JP 58180010 A JP58180010 A JP 58180010A JP 18001083 A JP18001083 A JP 18001083A JP S6070496 A JPS6070496 A JP S6070496A
Authority
JP
Japan
Prior art keywords
time series
parameter time
feature parameter
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58180010A
Other languages
English (en)
Inventor
佐藤 泰雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58180010A priority Critical patent/JPS6070496A/ja
Publication of JPS6070496A publication Critical patent/JPS6070496A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (5)発明の技術分野 本発明は音声認識処理方式、特に未知入力音声を細かい
フレーム周期で分析して、特徴パラメーパラメータ時系
列の部分時系列を抽出して登録しておくようにし、認識
率を向上させるとともに。
メモリおよび照合時間の削減を可能にした音声認識処理
方式に関するものである。
(ト) 従来技術と問題点 未知入力音声の認識にあたっては、一般に、登録用音声
から抽出した特徴パラメータ時系列を。
単語(単音節を含む)毎に登録した辞書を用意しておき
、未知入力音声から同じ手法により抽出−した特徴パラ
メータ時系列と上記辞書の各特徴パラメータ時系列との
距離を演算して、最も小さい距離のものを認識結果とT
るようにされている。特徴パラメータ時系列を抽出する
場合、ある時間間隔で分析するようにされるが、一般に
1時間分解能があがれば、認識率は向上Tるのに対し、
情報量の増加によって、辞書等のためのメモリ量および
照合時間が増大することとなる。
すなわち、従来方式によれば、標準パターンとして用意
される辞書中の特徴パラメータ時系列のフレーム周期と
、未知入力音声から抽出される特徴パラメータ時系列の
フレーム周期とは1通常。
等しくなるよ′うされていた。そのため、メモリ量およ
び照合時間を増大せずに認識率を向上させることは困難
であり、一方、認識率を劣化させずに。
メモリ量および照合時間を削減することも困難であった
(q 発明の目的と構成 本発明は上記問題点の解決を図り1分析フレーム位置の
違いによるパラメータの値の差を、入力音声に対するフ
レーム周期を細かくすることによって少なくシ、認識率
を向上させ、また、辞書に登録する特徴パラメータ時系
列は、相対的に粗くして、メモリ量および照合時間を削
減可能にすることを目的としている。そのため9本発明
の音声認識処理方式は、未知入力音声を音響分析して得
られる特徴パラメータ時系列と、予め辞書中(=格納さ
れた特徴パラメータ時系列との照合によって。
音声認識を行う音声認識システムにおいて、上記辞書中
の特徴パラメータ時系列は登録用音声を粗いフレーム周
期で分析格納されるよう構成され。
未知入力音声を細かいフレーム周期で分析し特徴パラメ
ータ時系列を算出する音響分析部と、該音響分析部が算
出した特徴パラメータ時系列を上記辞書中の特徴パラメ
ータ時系列のフレーム周期にそれぞれ対応する周期の複
数の入力特徴パラメータ時系列に分割する分割部と、該
分割部が分割した入力特徴パラメータ時系列を各々上記
辞書中の特徴パラメータ時系列と照合し、そのうち最も
小さい距離を入力音声と辞書中の候補音声との距離とし
て照合判定する照合判定部とをそなえたことを特徴とし
ている。
もう1つの本発明の音声認識処理方式は、未知入力音声
を音響分析して得られる特徴パラメータ時系列と、予め
辞書中に格納された特徴パラメータ時系列との照合によ
って、音声認識を行う音声認識処理方式において、上記
辞書中の特徴パラメータ時系列は登録用音声を粗いフレ
ーム周期で分析格納されるよう構成され、未知入力音声
を細かいフレーム周期で分析し特徴パラメータ時系列を
算出する音響分析部と、該音響分析部が算出した特徴パ
ラメータ時系列と上記辞書中の各特徴パラメータ時系列
とについて時間軸伸縮の割合を入力音声側について大き
くした非線形時間軸圧縮による照合を行う照合判定部と
をそなえたことを特徴としている。以下図面を参照しつ
つ説明する。
(ト) 発明の実施例 第1図は本発明の一実施例処理を説明するための図、第
2図は本発明の一実施例ブロック図を示す。
本発明の場合9例えば第1図図示の如く、辞書に標準パ
ターンとして登録される登録パラメータ時系列のフレー
ム周期は、入力音声から抽出される入力パラメータ時系
列のフレーム周期に対して。
n対1の関係があるようにされる。換言すれば。
辞書に登録パラメータ時系列を登録するとき、登録用音
声から認識時における場合と同様に入力パラメータ時系
列を生成し、この入力パラメータ時系列を間引いた部分
時系列を、登録パラメータ時系列として登録する。こう
すると、入力パラメータ時系列は、相対的に細かいフレ
ーム周期、登録パラメータ時系列は粗いフレーム周期と
なる。
登録パラメータ時系列と入力パラメータ時系列とを照合
して、認識を行う場合、照合に先立って。
入力パラメータ時系列を、登録パラメータ時系列のフレ
ーム周期と等しい周期の複数のパラメータ時系列(二分
割する。第1図図示の場合、入力パラメータ時系列は、
白丸の列で表わされた第1の入力分割パラメータ時系列
と、黒丸の列で表わされた第2の入力分割パラメータ時
系列とに分割されることとなる。このようにして生成さ
れた入力分割パラメータ時系列の各々について、登録パ
ラメータ時系列と照合し、それぞれマツチング距離を演
t1.Tる。そして、その中の最短距離のものを入力音
声と辞書中の候補音声との距離とする。
単に分析フレーム周期を粗くした場合には1分析フレー
ム位置の違い(二よる各パラメータの値の差が大きくな
り、認識率が悪くなるが、上記のようにすると1分割さ
れた複数のパラメータ時系列のいずれかが、辞書中のパ
ラメータ時系列の分析フレーム位置に近くなるため1位
置のずれによる誤差が除去されて、実質的な距離の精度
がよくなる。第1図図示の場会、登録パラメータ時系列
は。
白丸の列による入力分割パラメータ時系列に近似するた
め、その距離が候補音声の選択に用いられる0 次に、上記処理構成を、第2図図示ブロック図に従って
説明する。図中、1はマイクロホン、2は音響分析部、
3は分割部、4は切替部、5はパラメータ登録部、6は
辞書、7−1および7−2は入力分割パラメータバッフ
ァ、8は照合判定部、9は辞書入力部、10−1および
10−2は距離演算部、11は選択部、12は判定部を
表わす。
マイクロホン1から入力された音声信号は、音響分析部
2において周波数分析される。音響分析部2は1例えば
帯域フィルタ群、パラメータ抽出回路等を有しており、
入力音声の特微量(パラメータ)1例えば第1ホルマン
ト周波数に相当するモーメントM、や、第2ホルマント
周波数に相当するモーメントM、や、さらには、低域電
力や高域電力などを抽出し、これらの特微量に関するサ
ンプル点を決定して1%微量の時系列情報を生成する。
これから得られた入力パラメータ時系列の情報は。
分割部3へ供給される。
分割部3は1例えば第1図に入力分割パラメータ時系列
として示す如く、入力パラメータ時系列を複数に分割す
る。切替部4は、認識モード時と登録モード時とのデー
タの流れを切り替えるものであって、登録モードのとき
には、入力分割パラメータ時系列の一方を、パラメータ
登録部5へ転送する。パラメータ登録部5は、指定され
た項目名に対応させて、この入力分割パラメータ時系列
を辞書6に登録する。辞書6は1例えば磁気ディスク装
置等の外部記憶装置であって、認識対象の項目名と上記
パラメータ時系列とを対応させて記憶し保持する。
認識モードのときには1分割部3によって分割された入
力分割パラメータ時系列は、それぞれ入力分割パラメー
タバッファ7−1.7−2へ格納される。そして、照合
判定部8が起動される。照合判定部8は、まず、辞書入
力部9によって、辞書6に登録された各パラメータ時系
列を読み出し。
距離演算部10−1.10−2へ送出する。距離演算部
10−1においては、入力分割パラメータバッファ7−
1の内容と、登録パラメータ時系列とを9例えばダイナ
ミック・プログラミング(Dr)・マツチングにより照
合し、それらの距離をめる。同様に距離演算部10−2
においては、入力分割パラメータバッファ7−2の内容
と、登録パラメータ時系列との距離をめる。なお、距離
演算部10−1と距離演算部10−2とは、並列的に処
理をしてもよいし、また時間的にシリアルに処理をして
もよい請求められた距離は、それぞれ選択部11へ送ら
れる。選択部11は、その中で最も小さい距離を、入力
音声のパターンと当該登録パターンとの距離として1判
定部に通知する。上記距離の演算と選択とは、辞書中の
すべての登録パラメータ時系列について行われ1判定部
12は。
選択部11が7選択した距離の中で最も小さい距離をも
つ登録パラメータ時系列に対応する項目を認識結果とす
る。
第3図はもう1つの本発明の一実施例ブロック図、第4
図はDP整合窓の説明図、第5図は傾斜制限についての
説明図を示す。
図中、符号工ないし6,8,9.12は第2図に対応し
、10は距離演算部、15は制限チェック部、20はD
P整合窓、21はマツチング経路を表わす。
第2の本発明の場合にも、入力パラメータ時系列に対し
て、辞書6に登録される登録パラメータ時系列のフレー
ム周期が、相対的に粗くなるようにされる。すなわち、
音響分析部2によって、音響分析され抽出された入力パ
ラメータ時系列は。
切替部4へ送られる。登録モードの場合には、切替部4
は1分割部3へ入力パラメータ時系列を送り1分割部3
は、入力パラメータ時系列を所定の個数に分割して、そ
の部分時系列を抽出する。パラメータ登録部5は、こう
して作成されたパラメータ時系列を、標準の登録パラメ
ータ時系列として、その項目名に対応させて辞書6へ登
録する。
認識モードのとき、には、音響分析部2で生成された未
知入力音声の入力パラメータ時系列は、切替部4を経由
して、そのまま照合判定部8へ伝達される。照合にあた
って、辞書入力部9は、順次。
各登録パラメータ時系列を辞書6から読み出し。
距離演算部10に通知する。距離演算部10においては
、入力パラメータ時系列と各登録パラメータ時系列との
距離の演算が行われる。ところで。
本発明の場合、入力パラメータ時系列のパラメータ数は
、第1図に示したような分割を登録時に行うとすれば、
登録パラメータ時系列のパラメータ数の約2倍になる。
そこで、このパラメータ数の違いを1発声入力の時間の
相違であるかのように。
例えばDPマツチング等の非線形時間軸圧縮による照合
によって吸収する。分析フレニムの位置の違いによるパ
ラメータの値の差は、これによって少なくなることにな
る。
ところで、一般に、照合を行うにあたって、明らかに候
補とならないものを早期に検出して排除し、全体の照合
時間を短縮するために、いわゆるDP整合窓や、各種傾
斜制限等によ束照合条件を予め定めることが行われてい
る。DP整合窓の場合1例えば第4図図示の如く、マツ
チング経路21が一定の幅でのみ選択されるようC二さ
れ、もしDPW合窓20から外れるようなマツチング経
路21をとる場合、マツチングしないものとして演算が
打ち切られる。
同様に経路の傾きを一定範囲に限る条件を課し。
無意味なマツチングを避けるのが、いわゆる傾斜制限で
ある。第5図(イ)図示のものは、その1つの例であっ
て、マツチング経路が横方向または縦方向に2回連続し
て選択されることがないように定められている。
本実施例の場合1作為的に入力パターンのパラメータ数
が、登録パターンのパラメータ数よりも多くなるように
されていることに注意が必要である。従って、マツチン
グ経路の選択条件を、従来と同様に対称的に定めること
は、妥当ではない。
すなわち、入カバターンの見かけ上の時間軸圧縮を大き
くすることが許される条件を与える。第4図図示DP整
合窓のような条件の場合、整合窓は45°の傾きではな
く、より入カバターン軸側に傾くような範囲をもつよう
にされる。また1例えば第5図(イ)図示のような傾斜
制限は、第5図(ロ)図示のような横方向に伸びた非対
称傾斜制限に修正される。第3図図示制限チェック部1
5は9以上のような時間軸伸縮の割合についての所定の
制限条件をチェックするものである。
距離演算部10によって、所定の制限条件に合格した経
路でもって距離の演算が行われると、その結果は判定部
12へ通知される。判定部工2は通知された距離のうち
最も小さいものに対応する項目を認識結果と判定する。
このように1本実施例の場合、パラメータ時系列の長さ
1間隔の違いは9例えば非対称傾斜制限・整合窓による
DP照合等により吸収されることとなる。
上記各実施例においては、入力パラメータ時系列を2つ
に分割する例を説明したが、もちろん3組以上に分割し
てもよい。フレーム周期および分割数については、必要
とする認識精度、照合時間やメモリ量の制限等を考慮し
9例えば実験によって最適なもρを容易に選択すること
ができる。
■ 発明の詳細 な説明した如く本発明によれば、入力音声に対するフレ
ーム周期を細かくして9分析フレーム位置の違いによる
パラメータの値の差を小さくシ。
認識率を向上させることができる。一方、登録用フレー
ム周期を粗くすることができるので、辞書等のメモリ量
を削減することができ、また照合する時系列中のパラメ
ータ数が少なくなることから。
照合時間の短縮が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例処理を説明するための図、第
2図は本発明の一実施例ブロック図、第3図は他の本発
明の一実施例ブロック図、第4図はDP整合窓の説明図
、第5図は傾斜制限についての説明図を示す。 図中、2は音響分析部、3は分割部、5はパラメータ登
録部、6は辞書、8は照合判定部を表わす。 特許出願人 富士通株式会社 代理人弁理士 森 1) 寛 (外1名)千1図 閂熾#累 入力)望ターレ 1

Claims (2)

    【特許請求の範囲】
  1. (1)未知入力音声を音響分析して得られる特徴パラメ
    ータ時系列と、予め辞書中に格納された特徴パラメータ
    時系列との照合によって、音声認識を行う音声認識シス
    テムにおいて、上記辞書中の特徴パラメータ時系列は登
    録用音声を粗いフレーム周期で分析格納されるよう構成
    され、未知入力音声を細かいフレーム周期で分析し特徴
    パラメータ時系列を算出する音響分析部と、該音響分析
    部が算出した特徴パラメータ時系列を上記辞書中の特徴
    パラメータ時系列のフレーム周期にそれぞれ対応する周
    期の複数の入力特徴パラメータ時系列に分割する分割部
    と、該分割部が分割した入力特徴パラメータ時系列を各
    々上記辞書中の特徴パラメータ時系列と照合し、そのう
    ち最も小さい距離な入力音声と辞書中の候補音声との距
    離として照合判定する照合判定部とをそなえたことを特
    徴とする音声認識処理方式。
  2. (2) 未知入力音声を音響分析して得られる特徴パラ
    メータ時系列と、予め辞書中に格納された特徴パラメー
    タ時系列との照合によって、音声認識を行う音声認識処
    理方式におり、Xて、上記辞書中の特徴パラメータ時系
    列は登録用音声を狙いフレーム周期で分析格納されるよ
    う構成され、未知入力音声を細かいフレーム周期で分析
    し特徴パラメータ時系列を算出する音響分析部と、該音
    響分析部が算出した特徴パラメータ時系列と上記辞書中
    の谷′i8徴パラメータ時系列とについて時間軸伸縮の
    割合を入力音声側について大きくした非線形時間軸圧縮
    による照合を行う照合判定部とをそなえたことを特徴と
    する音声認識処理方式。
JP58180010A 1983-09-28 1983-09-28 音声認識処理方式 Pending JPS6070496A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58180010A JPS6070496A (ja) 1983-09-28 1983-09-28 音声認識処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58180010A JPS6070496A (ja) 1983-09-28 1983-09-28 音声認識処理方式

Publications (1)

Publication Number Publication Date
JPS6070496A true JPS6070496A (ja) 1985-04-22

Family

ID=16075873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58180010A Pending JPS6070496A (ja) 1983-09-28 1983-09-28 音声認識処理方式

Country Status (1)

Country Link
JP (1) JPS6070496A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6350895A (ja) * 1986-08-21 1988-03-03 日本電信電話株式会社 音声照合並列プロセツサ方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6350895A (ja) * 1986-08-21 1988-03-03 日本電信電話株式会社 音声照合並列プロセツサ方式

Similar Documents

Publication Publication Date Title
US4955056A (en) Pattern recognition system
US4403114A (en) Speaker recognizer in which a significant part of a preselected one of input and reference patterns is pattern matched to a time normalized part of the other
US4763278A (en) Speaker-independent word recognizer
US4712242A (en) Speaker-independent word recognizer
US4677673A (en) Continuous speech recognition apparatus
US4903306A (en) Voice recognition using an eigenvector
JPS60158498A (ja) パターン照合装置
JPS6070496A (ja) 音声認識処理方式
JPS61183696A (ja) 特定話者音声認識装置
JPS62111295A (ja) 音声認識装置
JPS62172400A (ja) 音声認識装置
JPS6368899A (ja) 音声認識装置
JPS6026399A (ja) 単語認識装置
JPS60147797A (ja) 音声認識装置
JPS63187376A (ja) パタ−ン認識装置
JPS60208800A (ja) 単語音声認識装置
JPS5882300A (ja) 音声認識方式
JPS59111697A (ja) 音声認識方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS6152698A (ja) 音声認識装置
JPS6151197A (ja) 音声認識装置
JPH04212199A (ja) 標準パターン登録方法
JPS59124388A (ja) 単語音声認識処理方式
JPS6147994A (ja) 音声認識方式
JPS595294A (ja) 音声認識装置