JPS63292199A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63292199A
JPS63292199A JP62126996A JP12699687A JPS63292199A JP S63292199 A JPS63292199 A JP S63292199A JP 62126996 A JP62126996 A JP 62126996A JP 12699687 A JP12699687 A JP 12699687A JP S63292199 A JPS63292199 A JP S63292199A
Authority
JP
Japan
Prior art keywords
pitch
standard pattern
speech
standard
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62126996A
Other languages
English (en)
Inventor
敏雄 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62126996A priority Critical patent/JPS63292199A/ja
Publication of JPS63292199A publication Critical patent/JPS63292199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は単語または音素や音節を単位とする標準パタン
を有する音声認識装置に関し、特にピッチの高さ範囲別
に複数の標準パタンを用意した音声認識装置に関する。
〔従来の技術〕
音声認識装置は特定話者型と不特定話者型に分類される
。特定話者型の場合2発声者が変わるたびに標準パタン
を登録し直す必要がある。
一方、不特定話者型の場合、あらかじめ多数の話者から
集められた音声データから標準パタンか作成される。
従来、音声認識装置の標準パタンは認識対象単語に対し
て1個用意されていた。しかし2発声者のイントネーシ
ョンや方言等により認識率を向上させることができない
場合があるため。
同一単語の標準パタンを複数個用意することもあった。
この場合、音声認識装置の処理能力上、認識語数が限ら
れているため、認識する単語の種類を減らして認識率の
向上を図っていた。
第3図を参照して従来の一例を説明する。
入力音声1は音声分析部2に入力され特徴パラメータ3
が求められる。特徴パラメータには種々のものがあシ2
例えば自己相関係数やLPC相関係数やLPCケプスト
ラム係数等がある。
多数の人の音声を、単語あるいは音素、音節を単位とし
て分析して作った特徴パラメータのことを標準パタンと
呼び、゛ここでは音素を単位として音素標準パタン記憶
部8に蓄える。音声認識部4は小区間ごとに音声分析部
2から得られた特徴パラメータ3と音素標準パタン記憶
部8からの標準パタンである特徴パラメータとの距離を
計算し、ある一定のしきい値より小さいとその区間の音
素を決定する。そして、求まった音素5を単語認識部6
に入力し、単語辞書10を用いて単語の判定を行い、認
識結果7が得られる。
このような音声認識の方法は2例えば「ディジタル音声
処理」古井著、東海大学出版会、p160〜168に示
されている。
〔発明が解決しようとする問題点〕
ところで、上述した従来の不特定話者音声認識装置は、
男性2女性を問わず、多くの話者の音声データを集めて
標準パタンを作成しているので、どんな人の音声にも適
用でき、一様な認識率を確保できる。その反面、より認
識率を高め最適化するには、標準パタンの分布が男性用
または女性用に最適とは言えないため、より高い認識率
を得ることが難しいという欠点がある。
〔問題点を解決するための手段〕
本発明による音声認識装置は、ピッチ抽出部と、単語ま
たは音素や音節を単位としてピッチの高さ範囲別に用意
した複数の標準パタンの記憶部と、前記複数の標準パタ
ンの中からピッチ情報によシ標準パタンを選択する標準
パタン選択部とを新たに備えたことを特徴とする。
〔実施例〕
本発明について、第1図、第2図を参照して説明する。
本発明では、従来方式によるブロック構成に次の処理ブ
ロックを追加している。
ピッチ抽出部には入力音声1を分析してピッチ13を求
める。ピッチ抽出処理方法としては。
自己相関を求めその最大値をピッチとする方法が用いら
れる。
ピッチ別標準パタン選択部14では、ピッチの高さをい
くつかの範囲だ区切り(例えば、第2図のように2通常
、男性のピッチは低く女性のピッチは高いため、ピッチ
Aは80〜200Hz、ピッチBは150〜300Hz
とする。)、ピッチ13の高さによりピッチA又はピッ
チBを選択することにする。
ピッチ別標準パタ/記憶部16は、従来の標準パタン記
憶部(第3図8)の代わりに用いられ。
あらかじめ多数の人の音声データから単語、音素あるい
は音節を単位として標準パタンを作成し、この際、ピッ
チ周波数の高さにより1例えばピッチA用とピッチB用
の2種類の標準パタ/を用意して格納している。このた
め、ピッチAに属する人の入力音声は、ピッチAの標準
パタンによって距離計算が行われ最適化されているため
高い認識率が得られる。その根拠としては、一般に特定
話者の場合の認識率は約99チであるのに対して、不特
定話者の場合約90〜95チ程度で、あらかじめ登録さ
れている標準パタンの良し悪しが認識率に大きく影響し
ているためである。
〔発明の効果〕
以上説明したように2本発明は従来の不特定話者音声認
識装置の構成に加えて、入力音声からピッチ抽出を行い
、ピッチ別に用意された標準バタ/を用いることによっ
て標準パタンの最適化が図られ、高い認識率が得られる
という効果がある。また、同一単語の標準パタンを複数
個用意して認識対象語数を減らす方法ではないので2本
発明によシ認識率を向上させることで認識対象語数を増
やすことも可能である。
【図面の簡単な説明】
第1図は本発明の音声認識装置のブロック図であシ、第
2図は第1図におけるピッチ別標準パタンのピッチ周波
数範囲の例を示す図、第3図は従来の音声認識装置のブ
ロック図。 3・・・特徴パラメータ、13・・・ピッチ。 15・・・標準パタン選択指示情報。 <R(llG]L

Claims (1)

    【特許請求の範囲】
  1. 1、入力音声を分析する音声分析部と、入力音声からピ
    ッチを抽出するピッチ抽出部と、単語または音素や音節
    を単位としてピッチの高さ範囲別に用意した複数の標準
    パタンの記憶部と、ピッチ別の複数の標準パタンの中か
    ら前記抽出したピッチ情報にもとづいて標準パタンを選
    択する標準パタン選択部と、認識部とを備えたことを特
    徴とする音声認識装置。
JP62126996A 1987-05-26 1987-05-26 音声認識装置 Pending JPS63292199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62126996A JPS63292199A (ja) 1987-05-26 1987-05-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62126996A JPS63292199A (ja) 1987-05-26 1987-05-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63292199A true JPS63292199A (ja) 1988-11-29

Family

ID=14949085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62126996A Pending JPS63292199A (ja) 1987-05-26 1987-05-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63292199A (ja)

Similar Documents

Publication Publication Date Title
US5144672A (en) Speech recognition apparatus including speaker-independent dictionary and speaker-dependent
JPS6128998B2 (ja)
Tian et al. Tone recognition with fractionized models and outlined features
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
JPS63292199A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JPS61180297A (ja) 話者照合装置
JPS58149099A (ja) パタ−ン認識方式
JP2658426B2 (ja) 音声認識方法
JP2886879B2 (ja) 音声認識方法
JPH0323920B2 (ja)
JPH0619497A (ja) 音声認識方法
JPS63157199A (ja) 話者照合装置
JPS6287993A (ja) 音声認識装置
JPS6346496A (ja) 音声認識装置
JPS60202489A (ja) 音声認識方法
JPS59223500A (ja) 音声認識方法
JPS5958498A (ja) 音声認識装置
JPS63218999A (ja) 音声認識装置
JPH01319099A (ja) 音声認識装置
JPH11249681A (ja) 音響特徴抽出方法及び同方法を適用した音声認識装置
JPS63212999A (ja) 音声認識装置
JPS6120996A (ja) 音声認識装置