JPS62175800A - 音声パタ−ン作成方式 - Google Patents
音声パタ−ン作成方式Info
- Publication number
- JPS62175800A JPS62175800A JP1749486A JP1749486A JPS62175800A JP S62175800 A JPS62175800 A JP S62175800A JP 1749486 A JP1749486 A JP 1749486A JP 1749486 A JP1749486 A JP 1749486A JP S62175800 A JPS62175800 A JP S62175800A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- power
- voice
- parts
- creation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は、音声認識装置における音声パターン作成方式
に関する。
に関する。
皿米扱嵐
近年、音声認識技術の進歩はめざましく、単語だけでな
く単音節音声の認識も可能になってきた。
く単音節音声の認識も可能になってきた。
その中で簡易に音声の認識ができる方法として2値化処
理による方式(日本音響学会講演論文集昭和58年10
月、PL95〜196.3−1−8゜2値のTSPによ
る単語音声認識方式)が報告されている。この方式は、
単語音声の時間−周波数パターン(TSP)を図形処理
してパターンマツチングするもので、周波数方向に幅を
もつパターンとローカルビークパターンを重ね合わせて
類似度を求めるもので、両パターンとも2値化で表現で
きるようにしたものである。しかしこの方式はスペクト
ルを2値化処理するための音声の大きさに関する情報が
失われてしまうので憤語等の情報量の多い音声の認識に
は向いているが、単音節等、全てが類似しているような
パターンの比較には適していない。そこで日本音響学会
講演論文集昭和60年10月、P57〜58.2−4−
4.単音節音声認識の一方式に報告されたような音声の
パワー情報も2値化処理する方式が考えられ、これによ
って音声の大きさの時間変化によっても音声の違いが区
別できるに至った。しかし、この方式は、rOJ 、r
l、Jの2値化パターン作成時にスペク1−ルパターン
は音声の第2〜第3ホルマントが「1」となるように設
定するからスペクトル情報を担う「1」は1フレームに
つき2〜3個或いはそれ以上生じるのに対し、パワーを
表わす「1」は1フレームに1個となってしまい、パワ
ー情報はスペクトル情報に比ベラエイトが小さくなり、
折角の情報も効果的でないという欠点があった。
理による方式(日本音響学会講演論文集昭和58年10
月、PL95〜196.3−1−8゜2値のTSPによ
る単語音声認識方式)が報告されている。この方式は、
単語音声の時間−周波数パターン(TSP)を図形処理
してパターンマツチングするもので、周波数方向に幅を
もつパターンとローカルビークパターンを重ね合わせて
類似度を求めるもので、両パターンとも2値化で表現で
きるようにしたものである。しかしこの方式はスペクト
ルを2値化処理するための音声の大きさに関する情報が
失われてしまうので憤語等の情報量の多い音声の認識に
は向いているが、単音節等、全てが類似しているような
パターンの比較には適していない。そこで日本音響学会
講演論文集昭和60年10月、P57〜58.2−4−
4.単音節音声認識の一方式に報告されたような音声の
パワー情報も2値化処理する方式が考えられ、これによ
って音声の大きさの時間変化によっても音声の違いが区
別できるに至った。しかし、この方式は、rOJ 、r
l、Jの2値化パターン作成時にスペク1−ルパターン
は音声の第2〜第3ホルマントが「1」となるように設
定するからスペクトル情報を担う「1」は1フレームに
つき2〜3個或いはそれ以上生じるのに対し、パワーを
表わす「1」は1フレームに1個となってしまい、パワ
ー情報はスペクトル情報に比ベラエイトが小さくなり、
折角の情報も効果的でないという欠点があった。
目 的
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声によるパターン間差異を強調するようなパタ
ーンを作ることを目的としてなされたものである。
特に、音声によるパターン間差異を強調するようなパタ
ーンを作ることを目的としてなされたものである。
構 成
本発明は、上記目的を達成するために、音声を周波数分
析し、周波数成分レベルの大きな部分とそうでない部分
を2値化して差異を出し、更に発声された音声の強弱を
表わすパワーをパワーの包絡線と他を2値化して差異を
出し、両者のパターンを結合して一つの音声パターンと
する音声パターン作成方式において、(1)パワーの一
定以上の値と他を2値化により差異を出したパターンと
、周波数のパターンとを結合して作ること、或いは、(
2)パワーの大きさを棒グラフ状にし、2値化処理して
差異を出したパターンと周波数のパターンとを結合して
作ることを特徴としたものである。以下、本発明の実施
例に基づいて説明する。
析し、周波数成分レベルの大きな部分とそうでない部分
を2値化して差異を出し、更に発声された音声の強弱を
表わすパワーをパワーの包絡線と他を2値化して差異を
出し、両者のパターンを結合して一つの音声パターンと
する音声パターン作成方式において、(1)パワーの一
定以上の値と他を2値化により差異を出したパターンと
、周波数のパターンとを結合して作ること、或いは、(
2)パワーの大きさを棒グラフ状にし、2値化処理して
差異を出したパターンと周波数のパターンとを結合して
作ることを特徴としたものである。以下、本発明の実施
例に基づいて説明する。
第5図は、従来の方法で作ったパターンで、スペクトル
パターンAは単音節/ k a /の冒頭の部分のスペ
クトルパターンで、該スペクトルパターンAは前述のご
とくスペクトル変換したものを2値化したものであり、
パワーパターンBは第6図に示すように/ k a /
を発声した時のパワーの時間変化をそのまま包絡を「1
」他を「o」で表わしたものである。なお、このパター
ンは10m5毎にサンプルされており、スペクトル部は
15個の周波数帯域、パワーレベルは8レベルとした。
パターンAは単音節/ k a /の冒頭の部分のスペ
クトルパターンで、該スペクトルパターンAは前述のご
とくスペクトル変換したものを2値化したものであり、
パワーパターンBは第6図に示すように/ k a /
を発声した時のパワーの時間変化をそのまま包絡を「1
」他を「o」で表わしたものである。なお、このパター
ンは10m5毎にサンプルされており、スペクトル部は
15個の周波数帯域、パワーレベルは8レベルとした。
本発明ではこのパワーの包絡線だけでなく包絡線の何割
か以上をrIJとして表わすものである。
か以上をrIJとして表わすものである。
つまり、第2図の斜線の部分をrlJとし他を「O」と
するもので第5図ではパワーパターンBは1フレームに
1つの「1」しが存在しなかったものが本発明では第3
図のように「1」の数が増加する。これによってスペク
トルパターンAにパワーパターンBが与える影響が増え
、パワーの形状差による認識率が向上する6 第1図は、上述のごときパターンを作成するための電剣
的ブロック線図、すなわち本発明の一実施例を説明する
ための電気的ブロック線図で、図中、1はマイク、2は
区間検出部、3はバンドパスフィルタ群、4はオールパ
スフィルタ、5は量子化部、6は2値化部、7及び8は
レジスタ、9はピーク正規化部、10はフレーム毎のピ
ークX閾値部、11はパターン作成部、12は組合せ部
。
するもので第5図ではパワーパターンBは1フレームに
1つの「1」しが存在しなかったものが本発明では第3
図のように「1」の数が増加する。これによってスペク
トルパターンAにパワーパターンBが与える影響が増え
、パワーの形状差による認識率が向上する6 第1図は、上述のごときパターンを作成するための電剣
的ブロック線図、すなわち本発明の一実施例を説明する
ための電気的ブロック線図で、図中、1はマイク、2は
区間検出部、3はバンドパスフィルタ群、4はオールパ
スフィルタ、5は量子化部、6は2値化部、7及び8は
レジスタ、9はピーク正規化部、10はフレーム毎のピ
ークX閾値部、11はパターン作成部、12は組合せ部
。
13はパターン部で、マイク1からの入力音声は、区間
検出部2により音声の区間が取り出され、次いで1例え
ば、15個のバンドパスフィルタから成るバンドパスフ
ィルタ群3によりスペクトル分析され、loms毎に量
子化され、2値化され、−汗声分がレジスタ7へ格納さ
れる。これと並行してオールパスフィルタ4を通過した
パワーがl0m5毎に量子化されて一音声分がレジスタ
8へ格納される。この−音声分のパワーのピークが第8
レベルになるよう正規化すると共に閾値1例えばパワー
の20%を掛けて「1」とする値を決め他をOとしたパ
ターンを作る。これとスペク1−ルパターンを組み合わ
せて本発明のパターンを作成することができる。更に、
この閾値を100%とすることで棒グラフ状のパワーパ
ターンができる。
検出部2により音声の区間が取り出され、次いで1例え
ば、15個のバンドパスフィルタから成るバンドパスフ
ィルタ群3によりスペクトル分析され、loms毎に量
子化され、2値化され、−汗声分がレジスタ7へ格納さ
れる。これと並行してオールパスフィルタ4を通過した
パワーがl0m5毎に量子化されて一音声分がレジスタ
8へ格納される。この−音声分のパワーのピークが第8
レベルになるよう正規化すると共に閾値1例えばパワー
の20%を掛けて「1」とする値を決め他をOとしたパ
ターンを作る。これとスペク1−ルパターンを組み合わ
せて本発明のパターンを作成することができる。更に、
この閾値を100%とすることで棒グラフ状のパワーパ
ターンができる。
この場合、パワーパターンが認識に与えるウェイトは最
大にすることができる。このようなパターンの例を第4
図に示す。
大にすることができる。このようなパターンの例を第4
図に示す。
効 果
以上の説明から明らかなように、本発明による音声認識
においては、パワー形状の差異が認識結果に与える影響
をもつようなパターンを作成することができる。
においては、パワー形状の差異が認識結果に与える影響
をもつようなパターンを作成することができる。
第1図は1本発明による音声パターン作成方式の一実施
例を説明するための電気的ブロック線図。 第2図は1本発明による音声パターンの一例を示す図、
第3図は、本発明によるパワースペクトルを2値化した
図、第4図は、本発明による2値化パターンの他の例を
示す図、第5図は、音声パターンを2値化した場合の従
来例の一例を示す図、第6図は、音声パワーの一例を示
す図である。 1・・・マイク、2・・・区間検出部、3・・・バンド
パスフィルタ群、4・・・オールパスフィルタ、5・・
・量子化部、6・・・2値化部、7,8・・・レジスタ
、9・・・ピーク正規化部、10・・・フレーム毎のピ
ークX閾値部、11・・・パターン作成部、12・・組
合せ部。 13・・・パターン部。
例を説明するための電気的ブロック線図。 第2図は1本発明による音声パターンの一例を示す図、
第3図は、本発明によるパワースペクトルを2値化した
図、第4図は、本発明による2値化パターンの他の例を
示す図、第5図は、音声パターンを2値化した場合の従
来例の一例を示す図、第6図は、音声パワーの一例を示
す図である。 1・・・マイク、2・・・区間検出部、3・・・バンド
パスフィルタ群、4・・・オールパスフィルタ、5・・
・量子化部、6・・・2値化部、7,8・・・レジスタ
、9・・・ピーク正規化部、10・・・フレーム毎のピ
ークX閾値部、11・・・パターン作成部、12・・組
合せ部。 13・・・パターン部。
Claims (2)
- (1)、音声を周波数分析し、周波数成分レベルの大き
な部分とそうでない部分を2値化して差異を出し、更に
発声された音声の強弱を表わすパワーをパワーの包絡線
と他を2値化して差異を出し、両者のパターンを結合し
て一つの音声パターンとする音声パターン作成方式にお
いて、パワーの一定以上の値と他を2値化により差異を
出したパターンと、周波数のパターンとを結合して前記
二つのパターンを作ることを特徴とする音声パターン作
成方式。 - (2)、音声を周波数分析し、周波数成分レベルの大き
な部分とそうでない部分を2値化して差異を出し、更に
発声された音声の強弱を表わすパワーをパワーの包絡線
と他を2値化して差異を出し、両者のパターンを結合し
て一つの音声パターンとする音声パターン作成方式にお
いて、パワーの大きさを棒グラフ状にし、2値化処理し
て差異を出したパターンと周波数のパターンとを結合し
て前記一つのパターンを作ることを特徴とする音声パタ
ーン作成方式。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1749486A JPS62175800A (ja) | 1986-01-29 | 1986-01-29 | 音声パタ−ン作成方式 |
US06/908,681 US4827519A (en) | 1985-09-19 | 1986-09-17 | Voice recognition system using voice power patterns |
GB8627870A GB2187585B (en) | 1985-11-21 | 1986-11-21 | Voice spectrum analyzing system and method |
DE19863639756 DE3639756A1 (de) | 1985-11-21 | 1986-11-21 | Stimmspektrumsanalyseeinrichtung und -verfahren |
GB8828070A GB2208954B (en) | 1985-11-21 | 1988-12-01 | A voice pattern forming apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1749486A JPS62175800A (ja) | 1986-01-29 | 1986-01-29 | 音声パタ−ン作成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62175800A true JPS62175800A (ja) | 1987-08-01 |
Family
ID=11945554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1749486A Pending JPS62175800A (ja) | 1985-09-19 | 1986-01-29 | 音声パタ−ン作成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62175800A (ja) |
-
1986
- 1986-01-29 JP JP1749486A patent/JPS62175800A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5884260A (en) | Method and system for detecting and generating transient conditions in auditory signals | |
US4516215A (en) | Recognition of speech or speech-like sounds | |
US4827519A (en) | Voice recognition system using voice power patterns | |
EP0240329A2 (en) | Noise compensation in speech recognition | |
JPS63153598A (ja) | 音声スペクトル分析方法 | |
JPS5835600A (ja) | 音声情報処理方法 | |
JPS62175800A (ja) | 音声パタ−ン作成方式 | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JP2532618B2 (ja) | ピッチ抽出装置 | |
JPS59105697A (ja) | 音声認識装置 | |
JPS58190999A (ja) | 音声認識装置 | |
JPS6266300A (ja) | 音声認識方法及びその装置 | |
JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
JPS6061800A (ja) | 音声認識方式 | |
JP2844592B2 (ja) | 離散単語音声認識装置 | |
JPS59124400A (ja) | 音声パタ−ン・マツチング方式 | |
JPS6059394A (ja) | 音声認識装置 | |
JPS6075897A (ja) | 不特定話者用音声認識方式 | |
JP3002200B2 (ja) | 音声認識 | |
JPS625298A (ja) | 音声認識装置 | |
JPS6229798B2 (ja) | ||
JPS62283400A (ja) | 音声認識方法 | |
JPS6315298A (ja) | パタ−ン作成方式 | |
JPS6163899A (ja) | 単音節音声認識方法 | |
JPS62172400A (ja) | 音声認識装置 |