JPS62175800A - 音声パタ−ン作成方式 - Google Patents

音声パタ−ン作成方式

Info

Publication number
JPS62175800A
JPS62175800A JP1749486A JP1749486A JPS62175800A JP S62175800 A JPS62175800 A JP S62175800A JP 1749486 A JP1749486 A JP 1749486A JP 1749486 A JP1749486 A JP 1749486A JP S62175800 A JPS62175800 A JP S62175800A
Authority
JP
Japan
Prior art keywords
pattern
power
voice
parts
creation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1749486A
Other languages
English (en)
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1749486A priority Critical patent/JPS62175800A/ja
Priority to US06/908,681 priority patent/US4827519A/en
Priority to GB8627870A priority patent/GB2187585B/en
Priority to DE19863639756 priority patent/DE3639756A1/de
Publication of JPS62175800A publication Critical patent/JPS62175800A/ja
Priority to GB8828070A priority patent/GB2208954B/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識装置における音声パターン作成方式
に関する。
皿米扱嵐 近年、音声認識技術の進歩はめざましく、単語だけでな
く単音節音声の認識も可能になってきた。
その中で簡易に音声の認識ができる方法として2値化処
理による方式(日本音響学会講演論文集昭和58年10
月、PL95〜196.3−1−8゜2値のTSPによ
る単語音声認識方式)が報告されている。この方式は、
単語音声の時間−周波数パターン(TSP)を図形処理
してパターンマツチングするもので、周波数方向に幅を
もつパターンとローカルビークパターンを重ね合わせて
類似度を求めるもので、両パターンとも2値化で表現で
きるようにしたものである。しかしこの方式はスペクト
ルを2値化処理するための音声の大きさに関する情報が
失われてしまうので憤語等の情報量の多い音声の認識に
は向いているが、単音節等、全てが類似しているような
パターンの比較には適していない。そこで日本音響学会
講演論文集昭和60年10月、P57〜58.2−4−
4.単音節音声認識の一方式に報告されたような音声の
パワー情報も2値化処理する方式が考えられ、これによ
って音声の大きさの時間変化によっても音声の違いが区
別できるに至った。しかし、この方式は、rOJ 、r
l、Jの2値化パターン作成時にスペク1−ルパターン
は音声の第2〜第3ホルマントが「1」となるように設
定するからスペクトル情報を担う「1」は1フレームに
つき2〜3個或いはそれ以上生じるのに対し、パワーを
表わす「1」は1フレームに1個となってしまい、パワ
ー情報はスペクトル情報に比ベラエイトが小さくなり、
折角の情報も効果的でないという欠点があった。
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声によるパターン間差異を強調するようなパタ
ーンを作ることを目的としてなされたものである。
構   成 本発明は、上記目的を達成するために、音声を周波数分
析し、周波数成分レベルの大きな部分とそうでない部分
を2値化して差異を出し、更に発声された音声の強弱を
表わすパワーをパワーの包絡線と他を2値化して差異を
出し、両者のパターンを結合して一つの音声パターンと
する音声パターン作成方式において、(1)パワーの一
定以上の値と他を2値化により差異を出したパターンと
、周波数のパターンとを結合して作ること、或いは、(
2)パワーの大きさを棒グラフ状にし、2値化処理して
差異を出したパターンと周波数のパターンとを結合して
作ることを特徴としたものである。以下、本発明の実施
例に基づいて説明する。
第5図は、従来の方法で作ったパターンで、スペクトル
パターンAは単音節/ k a /の冒頭の部分のスペ
クトルパターンで、該スペクトルパターンAは前述のご
とくスペクトル変換したものを2値化したものであり、
パワーパターンBは第6図に示すように/ k a /
を発声した時のパワーの時間変化をそのまま包絡を「1
」他を「o」で表わしたものである。なお、このパター
ンは10m5毎にサンプルされており、スペクトル部は
15個の周波数帯域、パワーレベルは8レベルとした。
本発明ではこのパワーの包絡線だけでなく包絡線の何割
か以上をrIJとして表わすものである。
つまり、第2図の斜線の部分をrlJとし他を「O」と
するもので第5図ではパワーパターンBは1フレームに
1つの「1」しが存在しなかったものが本発明では第3
図のように「1」の数が増加する。これによってスペク
トルパターンAにパワーパターンBが与える影響が増え
、パワーの形状差による認識率が向上する6 第1図は、上述のごときパターンを作成するための電剣
的ブロック線図、すなわち本発明の一実施例を説明する
ための電気的ブロック線図で、図中、1はマイク、2は
区間検出部、3はバンドパスフィルタ群、4はオールパ
スフィルタ、5は量子化部、6は2値化部、7及び8は
レジスタ、9はピーク正規化部、10はフレーム毎のピ
ークX閾値部、11はパターン作成部、12は組合せ部
13はパターン部で、マイク1からの入力音声は、区間
検出部2により音声の区間が取り出され、次いで1例え
ば、15個のバンドパスフィルタから成るバンドパスフ
ィルタ群3によりスペクトル分析され、loms毎に量
子化され、2値化され、−汗声分がレジスタ7へ格納さ
れる。これと並行してオールパスフィルタ4を通過した
パワーがl0m5毎に量子化されて一音声分がレジスタ
8へ格納される。この−音声分のパワーのピークが第8
レベルになるよう正規化すると共に閾値1例えばパワー
の20%を掛けて「1」とする値を決め他をOとしたパ
ターンを作る。これとスペク1−ルパターンを組み合わ
せて本発明のパターンを作成することができる。更に、
この閾値を100%とすることで棒グラフ状のパワーパ
ターンができる。
この場合、パワーパターンが認識に与えるウェイトは最
大にすることができる。このようなパターンの例を第4
図に示す。
効   果 以上の説明から明らかなように、本発明による音声認識
においては、パワー形状の差異が認識結果に与える影響
をもつようなパターンを作成することができる。
【図面の簡単な説明】
第1図は1本発明による音声パターン作成方式の一実施
例を説明するための電気的ブロック線図。 第2図は1本発明による音声パターンの一例を示す図、
第3図は、本発明によるパワースペクトルを2値化した
図、第4図は、本発明による2値化パターンの他の例を
示す図、第5図は、音声パターンを2値化した場合の従
来例の一例を示す図、第6図は、音声パワーの一例を示
す図である。 1・・・マイク、2・・・区間検出部、3・・・バンド
パスフィルタ群、4・・・オールパスフィルタ、5・・
・量子化部、6・・・2値化部、7,8・・・レジスタ
、9・・・ピーク正規化部、10・・・フレーム毎のピ
ークX閾値部、11・・・パターン作成部、12・・組
合せ部。 13・・・パターン部。

Claims (2)

    【特許請求の範囲】
  1. (1)、音声を周波数分析し、周波数成分レベルの大き
    な部分とそうでない部分を2値化して差異を出し、更に
    発声された音声の強弱を表わすパワーをパワーの包絡線
    と他を2値化して差異を出し、両者のパターンを結合し
    て一つの音声パターンとする音声パターン作成方式にお
    いて、パワーの一定以上の値と他を2値化により差異を
    出したパターンと、周波数のパターンとを結合して前記
    二つのパターンを作ることを特徴とする音声パターン作
    成方式。
  2. (2)、音声を周波数分析し、周波数成分レベルの大き
    な部分とそうでない部分を2値化して差異を出し、更に
    発声された音声の強弱を表わすパワーをパワーの包絡線
    と他を2値化して差異を出し、両者のパターンを結合し
    て一つの音声パターンとする音声パターン作成方式にお
    いて、パワーの大きさを棒グラフ状にし、2値化処理し
    て差異を出したパターンと周波数のパターンとを結合し
    て前記一つのパターンを作ることを特徴とする音声パタ
    ーン作成方式。
JP1749486A 1985-09-19 1986-01-29 音声パタ−ン作成方式 Pending JPS62175800A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP1749486A JPS62175800A (ja) 1986-01-29 1986-01-29 音声パタ−ン作成方式
US06/908,681 US4827519A (en) 1985-09-19 1986-09-17 Voice recognition system using voice power patterns
GB8627870A GB2187585B (en) 1985-11-21 1986-11-21 Voice spectrum analyzing system and method
DE19863639756 DE3639756A1 (de) 1985-11-21 1986-11-21 Stimmspektrumsanalyseeinrichtung und -verfahren
GB8828070A GB2208954B (en) 1985-11-21 1988-12-01 A voice pattern forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1749486A JPS62175800A (ja) 1986-01-29 1986-01-29 音声パタ−ン作成方式

Publications (1)

Publication Number Publication Date
JPS62175800A true JPS62175800A (ja) 1987-08-01

Family

ID=11945554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1749486A Pending JPS62175800A (ja) 1985-09-19 1986-01-29 音声パタ−ン作成方式

Country Status (1)

Country Link
JP (1) JPS62175800A (ja)

Similar Documents

Publication Publication Date Title
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
US4516215A (en) Recognition of speech or speech-like sounds
US4827519A (en) Voice recognition system using voice power patterns
EP0240329A2 (en) Noise compensation in speech recognition
JPS63153598A (ja) 音声スペクトル分析方法
JPS5835600A (ja) 音声情報処理方法
JPS62175800A (ja) 音声パタ−ン作成方式
JP2992324B2 (ja) 音声区間検出方法
JP2532618B2 (ja) ピッチ抽出装置
JPS59105697A (ja) 音声認識装置
JPS58190999A (ja) 音声認識装置
JPS6266300A (ja) 音声認識方法及びその装置
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS6061800A (ja) 音声認識方式
JP2844592B2 (ja) 離散単語音声認識装置
JPS59124400A (ja) 音声パタ−ン・マツチング方式
JPS6059394A (ja) 音声認識装置
JPS6075897A (ja) 不特定話者用音声認識方式
JP3002200B2 (ja) 音声認識
JPS625298A (ja) 音声認識装置
JPS6229798B2 (ja)
JPS62283400A (ja) 音声認識方法
JPS6315298A (ja) パタ−ン作成方式
JPS6163899A (ja) 単音節音声認識方法
JPS62172400A (ja) 音声認識装置