JPS6061800A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS6061800A
JPS6061800A JP58170040A JP17004083A JPS6061800A JP S6061800 A JPS6061800 A JP S6061800A JP 58170040 A JP58170040 A JP 58170040A JP 17004083 A JP17004083 A JP 17004083A JP S6061800 A JPS6061800 A JP S6061800A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
patterns
time
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58170040A
Other languages
English (en)
Inventor
米山 正秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58170040A priority Critical patent/JPS6061800A/ja
Publication of JPS6061800A publication Critical patent/JPS6061800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 改橢分敷 7本発明は、パターンマツチング技術を用いた音声認識
方式に関する。
従来技術 単語音声を認識するための新しいパターンマツチング方
式として、本出願人は、先に、周波数と時間を変数とす
るスペクトルグラフを基本として2種類の2次元パター
ン(ローカルピークの軌跡を表わす細線化パターンと2
値化されたブロードパターン)の重なり具合を用いて類
似度を算出する方式について種々提案した。
更に詳細に説明すると、単語の音声認識を目的として、
マイクロホンから取り入れた単語の音声信号を特徴抽出
部に導き、何らかの方法によって数nl S e C〜
数十m5ec程度の時間間隔で周波数分析し、音声信号
の短時間パワースペタトルをめ、これを特徴量とした場
合、これ等のq;y rb量を周波数と時間を2軸とし
て2次元平面上に表示したパターンは音声のタイ11ス
ベタ1−ルパターンとして知られている。本発明は、こ
のタイムスペクトルパターンを基本として、そのローカ
ルビークを連ねた細線化パターン(第1図)と、ある閾
値を設け、これによって2値化したブロードパターン(
第2図)との2種類のパターンの重畳比較により類似度
を算出し、認識をおこなう方式に係わるものである。而
して、上記2種類のパターンのマツチング処理をおこな
う場合、各時間軸と周波数を揃えて比較する必要がある
。しかしなから、同一話者による同一単語であっても発
声毎の発声速度のバラツキによってマツチングをすべき
辞書″のパターンと入カバターンの時間軸の長さが異な
りそのままではマツチングができない。したかつて、従
来は辞書または入力のいずれか一方のタイムスペクトル
パターンの時間軸を線形し;伸縮して他方のパターンの
時間軸の長さに合せて類似度al算をおこなう線形伸縮
マツチンタ′方弐殻用いていた。しかしなから、単語音
声の発声速度の変動は必ずしも線形ではなく、単語を構
成する音声によって速度変動か異なり、そのため線形マ
ツチングでは十分な認識率が得られなかった。
目 的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、発声毎の発声速度の変動によって生じるタイムス
ペクトルパターンの時間軸の長さのバラツキを吸収でき
、線形伸縮マツチングにおいても良好な認識率が得られ
るようにした音声認識方式を提供することを目的として
なされたものである。
構 成 本発明の構成について、以下、一実施例に基づいて説明
する。
第3図は、本発明による音声認識方式の一実施例を説明
するための電気的ブロック線図で、図中、1はマイクロ
ホン、2は前処理部、3は周波数分析部、4は登録/認
識切替スイッチ、5は2値ソロ−ドパターン作成部、6
はN個のパターンを保持するレジスタと加算器、7は辞
書パターンメモリ部、8はローカルピーク細線化パター
ン作成部。
9は線形伸縮および類似度計算部で、本発明においては
、21直化されたブロードパターンl 辞書パターンと
して予め登録しておくが、その際、同一単語についてそ
れぞれN回(複数回)発声を試みこの結果生しるN個の
2値化ブロードパターンを線形伸縮によって時間軸の長
さを揃えて加算したものをその単語音声の辞書とした登
録しておく。
この様にして作成した辞書パターンはN個の2値化パタ
ーンの加算で作られるため、N段階のレベルを有するパ
ターンとなる。従って、この辞書パターンは発声の際に
発声速度が変動しにくい部分(タイムスペクトルパター
ン上において)は大きな値を持つのに対し、発声速度が
変動しやすい部分は、小さな値となり1時間軸方向にわ
たって。
重み付されたパターンとなる。この場合、人カバターン
としては、ローカルピークの軌跡である細線化パターン
を用いるので、発声速度の安定度が重みイ」けされた辞
書を用いることにより通常の線形伸縮マツチングでも十
分に発声速度の吸収ができ、十分良好な認識率を得るこ
とか出来る。
(例1) N=3こした場合の類似度a1算式は、ただし、I−類
似度 PO:辞書と入力が重なった点数に荷重をかけた値Po
′:辞書と入力が重なった点数 Pd:辞書の点数(レベル” 2 ”以の数)Pr:入
力の点数(レベル” 1 ”の数)となる。
(例2) 荷重辞書作成の方法として、発声の異なるN個の2値パ
ターンを加算する方法以外に、例えは通常の振幅レベル
を持ったタイt1スペクトルパターンをN個加算した後
の適当な段階に複数のスレシホール(へを設けて適当な
数M段階に量子化して不;5重辞書を作る方法もある。
(例3) 辞書パターンをN段階に荷重したパターンとして、入カ
バターンをローカルピータによる細線1ヒバターンでな
く2値のブロードパターンにしてマツチングをおこなう
方法もある。
(例4) 辞書パターンと入カバターンを共にローカルビータ軌跡
の細線化パターンにしてもよく、このようにしても指定
話者の場合は効果がある。この場合、辞書の細線パター
ンは時間軸方向に発声毎の安定度の重みがN段階にわた
って分布したものを用いる。
(例5) 辞書に荷重された細線化パターンを用いて、人力に2値
のブロードパターンを用いてもよい。
1−□米 以上の説明から明らかなように、本発明によると、発声
毎の発声速度の変動によった生しるタイムスペクトルパ
ターンの時間軸の長さのハラツギを吸収することができ
るので、線形伸縮マツチングにおいても良好な認識率を
得ることかで−きる。
【図面の簡単な説明】
第1図は、4111線化パターン、第2図は、ブロー1
〜パターン、第3図は、本発明の一実施例製説明するた
めの電気的フロック線図である。 1・・マイクロホン、2 前処理部、3・・周波数分析
部、4 登8/認識切替スイッチ、5・・2値フロート
パターン作成部、6・・・N個のパターンを保持するレ
ジスタと加算器、7 ・辞書パターンメモリ部、8 ロ
ーカルピーク細線化パターン作成部、9・・・線形伸縮
および類似度di算部。

Claims (1)

    【特許請求の範囲】
  1. 周波数と時間を変数とする2次元平面上で表わせるタイ
    11スペクトルパターンを基本として辞書および入力の
    タイ11スペクトルパターンをそれぞれ2値またはそれ
    以」二のレベルに分割した後、これら2種の2次元パタ
    ーンの重なり具合を用いて類似度を算出する単語音声認
    識方式において、辞書イウ二成の際に同一単語の複数回
    の発声によるタイムスペクトルパターンを加算すること
    によって祠られる重みの付いたパターンを辞書のパター
    ンとして用いるようにしたことを特徴とする音声認識方
    式。
JP58170040A 1983-09-14 1983-09-14 音声認識方式 Pending JPS6061800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58170040A JPS6061800A (ja) 1983-09-14 1983-09-14 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58170040A JPS6061800A (ja) 1983-09-14 1983-09-14 音声認識方式

Publications (1)

Publication Number Publication Date
JPS6061800A true JPS6061800A (ja) 1985-04-09

Family

ID=15897495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58170040A Pending JPS6061800A (ja) 1983-09-14 1983-09-14 音声認識方式

Country Status (1)

Country Link
JP (1) JPS6061800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310196A (ja) * 1986-07-01 1988-01-16 株式会社リコー 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310196A (ja) * 1986-07-01 1988-01-16 株式会社リコー 音声認識装置

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS6184694A (ja) 認識用辞書学習方法
JPS634200B2 (ja)
JPS6061800A (ja) 音声認識方式
JPS6075897A (ja) 不特定話者用音声認識方式
JPS59204897A (ja) 音声認識辞書登録方式
JP2557497B2 (ja) 男女声の識別方法
JPS6346496A (ja) 音声認識装置
JP3002211B2 (ja) 不特定話者音声認識装置
JPS59205680A (ja) 音声パターン比較方法
JP2844592B2 (ja) 離散単語音声認識装置
JP2996977B2 (ja) 音声認識装置
JPS60198598A (ja) 音声認識方式
JPS59204898A (ja) 音声認識装置
JP2655637B2 (ja) 音声パターン照合方式
JPS58159598A (ja) 単音節音声認識方式
JPS63223696A (ja) 音声パタ−ン作成方式
JPS62255999A (ja) 単語音声認識装置
JPS5888797A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPS59195295A (ja) 音声認識辞書登録方式
JPH0469959B2 (ja)
JPS60115996A (ja) 音声認識装置
JPS625298A (ja) 音声認識装置
JPS625299A (ja) 音声認識装置