JPS5961894A - 音声メツセ−ジ識別方式 - Google Patents

音声メツセ−ジ識別方式

Info

Publication number
JPS5961894A
JPS5961894A JP17193182A JP17193182A JPS5961894A JP S5961894 A JPS5961894 A JP S5961894A JP 17193182 A JP17193182 A JP 17193182A JP 17193182 A JP17193182 A JP 17193182A JP S5961894 A JPS5961894 A JP S5961894A
Authority
JP
Japan
Prior art keywords
filter
input
output
sound
difference signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17193182A
Other languages
English (en)
Inventor
湯浅 啓義
大村 皓一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP17193182A priority Critical patent/JPS5961894A/ja
Publication of JPS5961894A publication Critical patent/JPS5961894A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は電子機器を音声メツセージによって操作するだ
めの音声メツセージ識別方式に関するものである。
第1図は従来の一般的な音声認識装置の基本構成を示す
ものであり、音声入力はフィルタバンクあるいはFFT
(高速フーリエ変換器)よりなるスペクトル分析部SA
で周波数スペクトル分析を行なわれ、次段のパラメータ
分析部PAで周波数スペクトル包絡のピーク値を分析さ
れ、周波数の低い方からホルマント(共振周波数)を求
められる。音振識別部VRは各ホルマントの大きさを分
析するこ七によ夕日本語の5母音/a/、/i/、/U
/、/e/、10/ に対応する音素を分析するもので
ある。日本語の5母音は、第2図の3次元ノラフに示す
ように第1ホルマシトから第3ホルマシトの各成分の大
きさを分析することにより特定することができるもので
ある。ところで、かかる従来例A?いては例えは160
Hz 〜6.3 KHzまでの周波数帯域を32チセy
ネルのフィルタにて分割する場合、谷フィルタの出力か
ら第1乃至第4ホルマントの各成分を求めるには、1つ
のフィルタ当たりの出力を8ピツトのデジタルデータで
表わしたとしても、1サンづル当たり32X8=256
ピツトの′tS報を処理する必要がめp1処処理属が低
下するという問題があった。またこの情報から第1乃至
第4の各ホルマントの成分を1つのホルマシト描たり5
ピツトのデジタルデータで表わしたとしても1+jンづ
ル当たり20ピツトの情報を照合処理部SGにおいて照
合する必要があり、かかる入カパターシと照合される標
準パターシを予め記憶しておく標準バターシ記憶部HM
の記憶容址もか々り大きくなるという問題があった。
そこで本発明者らは、従来から母音の特徴を良く表わす
周波数領域に通過周波数帯域の異なるフィルタ対を複数
組設けて、各フィルタ対の差信号出力を分析することに
よって少ない情報量で入カバターンを形成し、高速かつ
正確に音声メツセージの識別を行ない得るような装置の
開発に取り組んで来たものである。第3図はかかる従来
例の原理を示す図である。同図は3次元的な座標空間を
表わしておシ、0は互いに直父する3本の座標軸の原点
である。同図において、■H−vL軸は有声音のうち顎
の開きの広い音(広顎音VH)と顎の開きの狭い音(狭
顎音VL)の分布を示しており、広顎音VHの成分は0
.5〜1.0K)IZのフィルタを用いて抽出芒れ、狭
顎音VLの成分は0〜0゜5 KHzのフィルタを用い
て抽出され、各フィルタの差信号がVH−VL細軸上値
となっている。次にVA−VO軸は、有声音のうち母音
の/a/に近い音VAと、母音の10/に近い音(狭唇
口)vOの分布を示しており、母音の/a/に近い音(
広唇口)VAの成分は1.0〜2.0KHzのフィルタ
を用いて抽出され、母音の10/に近い音vOの成分は
0.5〜1.0KH2のフィルタを用いて抽出され、各
フィルタの差信号がVA−VO軸上の値となっている。
さらにVF−VB軸は、発声時の舌の位置が前の方に来
る音(前舌音VF)と、発声時の舌の位置が後の方に来
る音(後舌音VB)の分布を示しており、曲舌音VFの
成分は2.0〜3.2KHzのフィルタを用いて抽出さ
れ、後舌音VBの成分は1.0〜2.0KHzのフィル
タを用いて抽出され、各フィルタの差信号がVF−VB
軸上の値となっテイル。そしてかかる■1l−vL軸、
VA−VO軸、およびVF−VB軸の各成分を分析する
ことにより、第3図中にa、i、u、e、oの各記号で
示した領域に属する皆をそnぞれ母音の/a/、/i/
、/u/、/e/、10/に対応する音として識別して
いたものである。
しかるにかかる従来例にあっては、VH−VL軸、VA
−VO軸、およヒV F−V B軸上の値を上述のよう
に一対のフィルタの差信号出力によって得ているので、
発声する人が異なると必ずしも同じフィルタによっては
各有声音VH、VL 、 VA、VO,VF、VBの特
徴を正確に抽出できるとは限らないという問題があった
本発明は従来例のこのような問題点を解決するために為
されたものであり、発声する人が異なっても同じフィル
タ群を用いて入力音声の特徴を正しく抽出することがで
きるようにした音声メツセージ識別方式を提供すること
を目的とするものである。
第4図は本発明の要旨となる構成を端的に示すために、
特許請求の範囲に記載された機能をプロツク化して示し
たいわゆるりし一ム対応図である。同図において、Fz
Q % Flb XFaa % F2b 、 −−・”
、Fna、 Fnbは音声入力から相異なる母音のホル
マントが存在する相異なる周波数領域の短時間平均パワ
ーを取シ出すフィルタ対であり、これらの各フィルタ対
F1a、F1b−,・・・・・・・・・、Fna、 F
nbの出力はそれぞれ差動増幅手段S1、S2、・・・
・・・・・・、Snに入力されて差信号出力に変換され
る。そしてこの差信号出力は第1の記憶手段Mla %
 M2a %・・・・・・・・・、Mnaと、第2の記
憶手段Mxb 、 Mgb 、・・・・・・・・・、M
nbと、補正回路HIN H2、・・・・・・・・・、
出とに選択的に入力できるようになっている。しかして
本方式においては音声メツセージの識別を行なう前に、
まずフィルタFlaとFibよりなるフィルタ対につい
て、第1のフィルタF1aが抽出するホルマントに対応
する母音を標準的に発声して、このときに差動増幅手段
S1から出力される差信号出力を第1の記憶手段M1a
に入力記憶式ぜる。また第2のフィルタF1bが抽出す
るホルマントに対応する母音を標準的に発声して、この
ときに差動増幅手段S1から出力される差信号出力を第
2の記憶手段M l bに入力記憶させる。同様のこと
をフィルタF2a 、 Fgbよシなるフィルタ対から
、フィルタFna % Fnbよりなるフィルタ対まで
妃ついてそれぞれ行ない、各記憶部W Mp、a −M
na 、 M2b −Mnbに差動増幅手段82〜Sn
の出力を入力記憶烙セる。しかして第1の記憶手段M1
a−Mnaおよび第2の記憶手段Mxb ” Mnbの
記憶内容は、それぞれ相加平均化手段A1〜Anによっ
て相加平均されて、その相加平均値(足して2で割った
値)がオフセット値ax ”” anとして補正回路H
,−Hnに入力される。そして音声メツセージの識別を
行なうときには、各差動増幅手段81〜Snの出力から
上記オフセット値a1〜anをそれぞれ補正回路H1〜
Hnによって減算するものである。補正回路H1〜Hn
の出力は入カバターンとして照合処理部SGに入力され
、標準パターン記憶部HMに予め記憶きれだ複数種の標
準パターンと照合されて、入力バター ンに最も近い標
準パターンを入力メツセージとして識別するものである
。本発明はこのように、各母音を標準的に発声したとき
のオフセット値al”−’afiを算出して、補正回路
H1〜Hnにおいて減算処理しているから、発声者が異
なってもその#贋オフセット値a1〜anを算出し直せ
ば、同じフィルタ群を用いて入力音声の特徴を正しく抽
出することができるものである。
以下具体的な実施例を挙げて、本発明の構成を詳述する
。第5図は本発明による音声メツセージ識別装置のハー
ドウェア的な概略構成を示すブロック図である。同図に
おいて、音声はマイクf11から入力され、づリア、、
/づ(2)で高域強調された後、調整アシ−j fa)
でゲインおよびオフセットを調整される。調整アップ(
3)の出力はバランス調整回路(41)〜(43)を介
して、フィルタFv−,FulおよびFz〜F4にそれ
ぞれ人力される。フィルタFvは音声信号の中から有声
音の成分が多く分布する低周波成分を抽出するものであ
り、0〜I KHzの帯域フィルタ(5v)と、整流回
路(6v)および平均化回路(7v)とから構成されて
いる。またフィルタFuは音声信号の中から無声音の成
分が多く分布する高周波成分を抽出するものであり、5
〜12 KHzの帯域フィルタ(5u)と、整流回路(
6u)および平均化回路(7u)とから構成されている
。各フィルタFvおよびFuの出力は差動平均化回路(
81)K入力され、差信号を短時間平均化した信号に変
換される。一方フィルタF1〜F4は、それぞれ帯域フ
ィルタ(51)〜(54)と、整流回路(61)〜(6
4)および平均化回路(71)〜(74)とから構成さ
れており、O〜0.5 KHz、0.5〜I KHz 
−、1〜2 KHz %および2〜3.2 K七の各周
波数領域の短時間平均パワーをそれぞれ音声信号の中か
ら抽出するものである。フィルタF、とF2の各出力は
差動平均化回路(82)に入力されて差信号出力に変換
される。またフィルタF2とF3、およびF3とF4の
各出力はそれぞれ差動平均化回路(83)および(84
)に入力されて差信号出力に変換される。差動平均化回
路(81)〜(84)の各出力v1〜v4はマルチプレ
クサ(9)によって時分割多重化された後、対数変換器
(10)によシ対数値に変換される。
対数変換器(lO)の出力はんのコシバータ(1りによ
りデジタル値に変換されてI10ポート(12Jに入力
される。入力されたデータは一旦入カパターシRAMQ
萄に格納され、標準パターンRA M 04)に記憶さ
れている複数個の標準パターンのうちどれに一番近いか
を照合判定されて、その照合判定結果に基いて被制御機
@06)を制御するようになっている。これらの照合判
定動作等はCP U (181とプログラムROM0η
、およびワー士ン、jRAMHを有するマイクロコシe
′−ユータ09)によシ行なっているものである。なお
閣はマイクロバス(21)に接続されたFIFOバッフ
ァでhD、Iyoポート(12)を介して入力されたデ
ータを一旦記憶しておくものである。
次如第6図は第5図に示した音声メツセージ識別装置の
I10ポート02)よりも後段のマイク口コンヒュータ
(19)によって実現式れる音声メ゛シセージ識別処理
機能を一50ツク化して示したものである。
同図に示すように、差動平均化回路(82)〜(84)
の各出力V2〜Vaは、第1の記憶手段M1a % M
2a XM3aと、第2の記憶手段Mob −、M2b
 −、M3bと、補正回路H1、A2、A3に選択的に
入力されるようになっている。相加平均化手段Al、A
2、A3においては、上述の第4図の説明において述べ
たような方法によりオフセット値als A2、A3が
算出でれ、補正回路H1、A2、A3に入力式れる。補
正回路H1% B+1、A3の各出力(Vg  ax)
、(V3−ax)、(V4−ass)は3次元のベクト
ルとして行列計算部(22に入力式れ、5行3列の行列
を乗算されて母音の/a/、/i/、/U/、/e/、
10/を表わす各成分VaXVi、 Vu。
Ve、Voよりなる5次元のベクトルに変換される。
この変換式の一例を示せは次式のようになる。
かかる演算を行なうには、行列計算用のサブルーチシを
使用してもかまわないが、乗算回数が多くなるので、各
信号(Vgal)、(V3  A2)、および(Va 
 ass)をそれぞれ4ピット程度で表わして、乗算を
テ〜づル参照によって行なうようにすれば処理速度を高
速化することができるものである。かかる行列計算部t
Zaにおいて算出されたVa〜Voの各成分は最大値判
定部□□□)に入力きれて、最大値をとる成分のみが1
つの符号として複合符号化処理部r27)に出力される
よう罠なっている。一方、差動平均化回路(81)の出
力V1は判定部C241において基準値Rv、 Ru 
(Rv) 0 >Ru )と比較さrt、出力v1が基
準値Rvよりも大きい場合には有声音Vと判定される。
また上記出力V1が基準値Ruよりも小さい場合には無
声音Uと判定され、基準値RuとRvとの間であれば無
音Sと判定される。(2均は無音区間を検出するためQ
Sカリンタであり、有声音Vまたは無声音Uが検出され
るとリセットされて音声入力動作を開始させ、その後無
音Sが一足時間以上続くとカラシトアップして音声入力
動作を停止jるようになっている。まだ例はV力すンク
であり、有声音Vが入力するとカラシト開始して次に無
音Sまたは無声音Uが入力式れるまでの間の時間を計測
し、継続時間の短い有声音Vmを検出したときには複合
符号化処理部(2ηに検出出力を入力するようになって
いる。複合符号化処理部(2)ηは、判定部+241か
ら出力される符号がU′またはSであるときには、その
符号をそのまま出力し、また判定部閾から出力きれる符
号がVであると@2には、最大値判定部(23)から出
力畑れるVa、 Vi、 Vu、 Ve、 Voのうち
のいずれか1つの符号を出力するものである。
ただし、符4+vの継続時間が特に短いときには、■カ
ウンタシロ)から出力される符号■を出力するものであ
る。したがって複合符号化処理部(2ηからは、U% 
S XVm、 Va、 ViXVu、 YeXVoの合
計8通りの符号のうちいずれか1つが出力されるもので
ある。かかる符号およびその継続時間は例えば第7図に
示すように入力パターンRA M +1□□□にリスト
形式で記憶されるものである。時間軸正規化処理部C→
はかかる第7図に示すようなリスト形式のデータから継
続時間の総和Tを算出し、各複合符号の継続時間に例え
ば1000/′rという数値を掛けることによシ、全継
続時間の総和がほぼ1000サンプルになるように線形
の正規化を行なうものである。時間軸正規化処理部部の
出力は、音声メツセージの登録時には登録処理部−によ
り指定式れた登録チャシネルに対応する記憶領域を探し
出して、標準パターンRA M (14)に格納される
ものであり、また音声メツセージの認識時には入カバタ
ーンRA M 03)に格納されるものである。
第8図は相関係数記憶部(イ))と累算器01)による
照合処理動作を機能的にブロック化して示したものであ
る。同図において国は入カパターシの符号を入力パター
ンRAMu、llから1個だけ取り出して記憶する入カ
バターン符号レジスタ、+33)は標準パターンの符号
を標準パターンRA M (14)から1個だけ取り出
して記憶する標準パターン符号レジスタである。各レジ
スタ0乃ノ樽の出力は相関係数記憶部(30)に入力さ
れて、相関係数を出力されるようになっている。相関係
数記憶部0[相]力)ら出力される相関係数は累算器(
31)に入力されて、タイミンク発生回路(341から
の20ツクパルスが入力されるたびに相関係数が累算j
tLるものである。入カバターン符号レジスタ132V
7c記1.!されている符号に対応する継続時間は、人
カパターシ符号継続時間しジスタ州に入力バター′JR
AM(+a)から入力記憶きれておシ、このしじスタ(
3りの値はタイミンク発生回路13+1からのりDツク
パルスが入力されるたびに減算器(36)により1ずつ
カウントタウシされるものである。そして減算器(3G
)による減算結果がゼロになると、比較器(37)がこ
れを検出し、入カバターンRAM(I萄から次の入カバ
ターンの符号とその継続時間とを各レジスタ+32+ 
+351にロードするようになっている。一方、標準パ
ターン符号レジスタI;33に記憶されている符号に対
応する継続時間は、標準パターン符号継続時間レジスタ
(ハ)に標準パターンRA M 04)から入力記憶さ
れており、このレジスタノ樽の値もタイ−、,7タ発生
回路(Iからのクロックパルスが入力されるたびに減算
器(39)によシ1ずつ力ウシトタウシされ、減算結果
がゼロになると比較器(剌がこれを検出して次の符号と
その継続時間を標準パターンRAMQ4]からレジスタ
m31Mに入力するようになっている。なおかかる第8
図のブロック図に示す照合処理動作は、実際にはCPU
(16+を含むマイクロコンピュータθ9)によって実
現烙れるものであり、また相関係数記憶部−はプロプラ
ムROM07)内(7)特定のアドレス領域に設けられ
るものである。第1表はこの相関係数記憶部(ト)の記
憶自答の一例を示すものである。
第1表 第1表において、横の欄および縦の欄はそれぞれ標準パ
ターンの符号および入カバターンの符号を示しておシ、
例えは標準パターンの符号がVaであり、しかも人カパ
ターシの符号もVaであるときには、相関係数記憶部婢
)の出力は2となり、相関関係が大きいことを示す。ま
だ標準パターンの符号がUであシ、人カバターンの符号
がVaであるときには、相関係数記憶部(30)の出力
は−2となり、相関関係が小はいことを示f、したがっ
て相関係数記憶部((至)からの出力を累算器ノ1)に
より累算することにより、入カバターンと各標準パター
ンとの相関度を計算することができるものである。計算
された相関度は有意性検定部(41)に入力されて、入
カパターシに1番近い標準パターンについての相関度が
所定の基準値を上回っておシ、シかも入力パターンに2
査目に近い標準パターンについての相関度との差が所定
の基準値を上回っている場合には、入カバターンに1番
近い標準パターンを入力メツセージとして認識し、その
他の場合には音声の再入力を促すようにするものである
。出力部(44は有意性検定部(41)から出力された
認識結果に基いて、被制御機器05)を制御するもので
ある。
ところで各フィルタF1〜F4の通過周波数帯域は、上
述のようにそれぞれ0〜0.5 KHz 、  0.5
〜1゜0 KHz、  1.0〜2.0 KHz、  
2.0〜3.2 KHz K設定されておシ、シたがっ
て第3図の従来例の説明において述べたようにフィルタ
F1とF2の出力の差を取る差動平均化回路(82)の
出力v2は広顎音VHと狭顎音VLとの比率を表わして
おシ、またフィルタF2とF3の出力の差を取る差動平
均化回路(83)の出力V3は/a/に近い音(広唇音
)VAと10/に近い音(狭唇音)vOとの比率を表わ
しており、嘔らにフィルタF3とF4の出力の差を取る
差動平均化回路(84)の出力V4は前舌音VFと後舌
音VBとの比率を表わしている。一方路9図は日本語の
5母音/a/ 、/i/、/u/、/e/、10/の第
1ホルマシトおよび第2ホルマントの分布を示すもので
ある。同図から明らかなようにフィルタF2とFlは顎
の洲きの広い有声音/a/と顎の開きの狭い有声音/i
/の第1ホルマシトを分析しており、またフィルタF4
とF3は発声時に舌の位置が前の方に来る有声音/i/
と、舌の位置が後の方に来る有声音/a/の第2ホルマ
ントを分析しており、さらにフィルタF3とF2は母音
の/a/と10/の第2ホルマシトを分析していること
がわかる。したがって本実施例にあっては、3゛つの母
音/a/、/l/、10/を標準的に発声することによ
り、オフセット値a1、a2、a3を求めることができ
るものである。第10図はかかるオフセット値81% 
a2、a3を求めるだめの処理手順を示すフローチャー
トである。同図に示すようにまず母音の/a/の音を標
準的に発声したときに差動平均化回路(811) (8
3) (84)から得られる出力V2、F3、F4は記
憶手段M1a % M2a XM3bに入力記憶芒れる
。また母音/i/の音を標準的に発声したときに差動平
均化回路(82) (84)から得られる出力V2、F
4は記憶手段Mob 、 M:saに入力記憶される。
さらに母音10/の音を標準的に発声したときに差Uノ
平均化回路(83)から得られる出力v3は記憶手段M
gbに入力記憶される。ところで差動平均化回路(82
)は、上述の第5図に示すようにフィルタF2の出力か
らフィルタFlの出力を減算した差信号を出力v2とし
ているものであるから、母音/a/の音を標準的〈発声
したときには出力V2は正となり、記憶手段M1aの記
憶内容は正になる。また母音/i/の音を標準的に発声
したときには出力V2は負となり、記憶手段Mlbの記
憶内容は負になる。しだがって記憶手段M1aとMlb
の記憶内容を相加平均して得られたオフセット値alの
絶対値は各記憶手段M1aとMlbの記憶内容の絶対値
の差を2で割った値となり、またこのオフセット値al
の符号は各記憶手段MlaとMlbの記憶内容のうち絶
対値の大きい側の符号と一致する。このだめフィルタF
1とF2のバランスが良好であるときにはオフセット値
alの絶対値は不妊くな9、出力v2に対する補正の程
度は不妊くなる。また発声者が異なってフィルタF、と
F2のバランスが不良となったときには、オフセット値
alの絶対値は大きくなシ、出力V2に対する補正の程
度は大きくなる。例えば母音/a/の音を標準的に発声
したときの差動平均化回路(82)の出力VaO値が+
83であり、母音/i/を標準的に発声したときの出力
v2の値が−51であるとすれはオフセット値a1は(
83−51) /2=16となり、出力V2が行列計算
部ff12に入力きれるときの補正直は(VQ−16)
となる。したがって補正後においては、母音/a/、/
i/を標準的に発声したときの補正値はそれぞ7L+6
7、−67となシ、フィルタFl、l’2のバランスが
良好になるものである。他のフィルタF2とF3、F3
とF4についても同様にオフセット値a2、a3の補正
によってバラシスを良好にすることができるものであり
、しだがって発声者が異なっても同じフィルタ群F1〜
F4にょp谷母音の特徴を正しく把えることができるも
のである。
本発明は以上のように構成きれており、音声入力から相
異なる母音のホルマントが存在する相異なる周波数領域
の短時間平均パワーをそれぞれ抽出する第1および第2
のフィルタよりなるフィルタ対を、少なくとも片方のフ
ィルタの抽出する周波数領域が互いに異なるように複数
組設けて、各フィルタ対について第1のフィルタが抽出
するホルマントに対応する母音を発声したときのフィル
タ対の差信号出力を記憶する第1の記憶手段と、第2の
フィルタが抽出するホルマントに対応する母音を発声し
たときのフィルタ対の差信号出方を記憶する第2の記憶
手段とを設けて、各フィルタ対について第1および第2
の記憶手段の記憶内容を相加平均したオフセット値をそ
れぞれ算出し、このオフセット値をそれぞれ各フィルタ
対の差信号出力から減算したデータを入カパターシとし
て、予め記憶されている複数種の標準パターυと照合し
、入カバターンに最も近い標準パターンを入力メツセー
ジとして識別するようにl〜だものであるから、背戸メ
ツセージを発声する発声者が異なっても、それぞれの発
声者について基本的な母音を標準的に発声させることに
上りオフセット値をその都贋算出し、各フィルタ対の差
信号出力からオフセット値を減算して発声者の個人差を
補正することができ、したがって同じフィルタ群を用い
て異なる発声者の母音の特徴を正しく分析することがで
きるという利点があり、またこのように発声者による個
人差を解消することができるので、比較的声の低い男性
についての標準パターンと、比較的声の旨い女性や子供
についての標準バターυとを共用することも可能になる
という利点がある。
【図面の簡単な説明】
第1図は従来例のブロック図、第2図は同上の原理説H
IJ図、第3図は他の従来例の原理説明図、第4図は本
発明の要旨となる構成を示すクレーム対応ブロック図、
第5図は本発明の一実施例のブロック図、第6図は同上
の処理機能を示すフロック図、第7図は人カバターシR
AMの記憶内容を示す図、第8図は照合処理動作を示す
フロック図、第9図は母音のホルマシトの周波数特性を
示す図、第1O図はオフセット値の計算手順を示すフロ
ーチャートである。 F1a5 plb、 Faas Fab、 Fna、 
Fnbはフィルタ、Sl、S2、S3は差動増幅手段、
Mla XM2a z Mnaは第1のWr2 t、を
手段、Mlb % MRb % Mnbは第2の記憶手
段、A1、A2、A3け相加平均化手段、Hl、811
%Hsは補正回路、SGは照合処理部、HMは標準パタ
ーシ記憶部である。 第1図 H2I 第3図 第9図 第10図 手続補正書(自発) 昭和5.81年 4月11日 特許庁長官殿 1、事件の表示 1も相57年特許願第1719凸1号 2、発 明の名称 音声メツセージ誠別方式 3、補正をする者 事件との関係      特許出願人 性  所  大阪府門真市大字門真1048番地名 称
 (583)松下電工株式会社 代表者小 林  郁 4、代理人 電話大阪(06) 345−7777 (代表)5、補
正命令の日付 自    発 訂     正     書 出願番号 特願昭57−171931号1、本願明細書
第16頁第10行目乃至第19行目の全文を次のように
訂正致します。 「 2、本願の添付図面中、第9図を別紙のように訂正致し
ます。 代理人 弁理士  石 1)長 七

Claims (1)

    【特許請求の範囲】
  1. +1+  音声入力から相異なる母音のホルマントが存
    在する相異なる周波数領域の短時間平均パワーをそれぞ
    れ抽出する第1および第2のフィルタよりなるフィルタ
    対を、少なくとも片方のフィルタの抽出する周波数領域
    が互いに異なるように複数組設けて、各フィルタ対につ
    いて第1のフィルタが抽出するホルマントに対応する母
    音を発声したときのフィルタ対の差信号出力を記憶する
    第1の目己憶手段と、第2のフィルタが抽出するホルマ
    ントに対応する母音を発声したときのフィルタ対の差信
    号出力を記憶する第2の記憶手段とを設けて、各フィル
    タ対について第1および第2の記憶手段の記憶内容を相
    加平均したオフセット値をそれぞれ算出し、このオフセ
    ット値をそれぞれ各フィルタ対の差信号出力から減算し
    たデータを入カバターンとして、予め記憶されている複
    数種の標準パターンと照合し、人カバターンに最も近い
    標準パターンを入力メツセージとして識別することを特
    徴とする音声メツセージ識別方式。
JP17193182A 1982-09-30 1982-09-30 音声メツセ−ジ識別方式 Pending JPS5961894A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17193182A JPS5961894A (ja) 1982-09-30 1982-09-30 音声メツセ−ジ識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17193182A JPS5961894A (ja) 1982-09-30 1982-09-30 音声メツセ−ジ識別方式

Publications (1)

Publication Number Publication Date
JPS5961894A true JPS5961894A (ja) 1984-04-09

Family

ID=15932481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17193182A Pending JPS5961894A (ja) 1982-09-30 1982-09-30 音声メツセ−ジ識別方式

Country Status (1)

Country Link
JP (1) JPS5961894A (ja)

Similar Documents

Publication Publication Date Title
KR910002198B1 (ko) 음성인식방법과 그 장치
JPH03137699A (ja) 音声認識装置
JPH0312319B2 (ja)
CN110570870A (zh) 一种文本无关的声纹识别方法、装置及设备
Hamid et al. Makhraj recognition for Al-Quran recitation using MFCC
Kaneko et al. A hierarchical decision approach to large-vocabulary discrete utterance recognition
Okamoto et al. Investigations of real-time Gaussian FFTNet and parallel WaveNet neural vocoders with simple acoustic features
JPS5961894A (ja) 音声メツセ−ジ識別方式
Warule et al. Hilbert-Huang Transform-Based Time-Frequency Analysis of Speech Signals for the Identification of Common Cold
JPS58108590A (ja) 音声認識装置
Majda et al. Modeling and optimization of the feature generator for speaker recognition systems
JPS5961895A (ja) 音声メツセ−ジ識別方式
Pol et al. USE OF MEL FREQUENCY CEPSTRAL COEFFICIENTS FOR THE IMPLEMENTATION OF A SPEAKER RECOGNITION SYSTEM
Hmich et al. Discriminating coding applied to the Automatic Speaker Identification
JPS58123598A (ja) 音声認識装置
JPS63220199A (ja) 音声認識装置
JPS62113197A (ja) 音声認識装置
JPS5961896A (ja) 音声メツセ−ジ識別方式
JPS60115996A (ja) 音声認識装置
JPS5924900A (ja) 音声メツセ−ジ識別方式
JPS59223498A (ja) 音素判別法
JPS58139199A (ja) 音声自動認識装置
Haniu et al. A study on a speech recognition method based on the selective sound segregation in noisy environment
JPS6086600A (ja) 音声認識方法
JPS6031195A (ja) 音声メツセ−ジ識別方式