JPS62131299A - 音声標準パタン自動作成装置 - Google Patents

音声標準パタン自動作成装置

Info

Publication number
JPS62131299A
JPS62131299A JP60271481A JP27148185A JPS62131299A JP S62131299 A JPS62131299 A JP S62131299A JP 60271481 A JP60271481 A JP 60271481A JP 27148185 A JP27148185 A JP 27148185A JP S62131299 A JPS62131299 A JP S62131299A
Authority
JP
Japan
Prior art keywords
pattern
standard
patterns
registered
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60271481A
Other languages
English (en)
Other versions
JPH07111639B2 (ja
Inventor
畑岡 信夫
天野 明雄
矢島 俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60271481A priority Critical patent/JPH07111639B2/ja
Publication of JPS62131299A publication Critical patent/JPS62131299A/ja
Publication of JPH07111639B2 publication Critical patent/JPH07111639B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は音声認識装置に係り、特に音節単位の標準音声
(標準パタン)を正確に作成するに好適な音声標準パタ
ンの自動作成に関するものである。
〔発明の背景〕
従来の音節単位の標準パタンの自動作成方法、装置とし
ては、音響学会講演論文集2−7−5(S57−10)
rVCVから切り出したCVパターンの識別による登録
の検討」に記載のように音素特有の特徴を示すパラメー
タ(@えば母音性。
有無/無音性、A音性など)を利用して、音素あるいは
音節単位に音声をセグメンテーションして標準パタンを
取り出すものや特開昭58−176699号[音声標準
パターン登録方式」に記載のようにあらかじめオフライ
ンで作成した音声基準パタンと登録音声とのD P (
D ynamic P rogra+ming)マツチ
ングにより基準パタンとの最適な対応関係を算出して登
録音声から標準パタンを取り出す方法などが知られてい
る。
前者の方法は音素特有のパラメータを探索することが必
要であり、また判定が閾値処理となることから処理が複
雑でかつ汎用的でないことが問題であった。後者の方法
は処理の内容が簡潔であるものの、単純に基準音声パタ
ンとのマツチングでは音素や音節の構造を細かにみるこ
とができないので本来の標準パタンとして望ましい音声
区間が得られなかったり(脱落)、不当な音声区間を取
り出したり(湧き出しあるいは付加)することが問題と
してあった。
〔発明の目的〕
本発明の目的は前記従来の問題を解決して、処理が簡潔
でかつ音節単位区間の取り出し1惧りの少なく性能の高
い音節単位の音声標準パタンの自動作成装置を提供する
ことにある。
〔発明の概要〕
前記目的を達成するために本発明では、前もって(オフ
ラインで)標準パタンの区間をマーク付けられた基準音
声パタンと登録された音声パタンとの非線形照合(DP
マツチング)で、母音などの位置対応を規定した対応制
限付きパタンマツチングを行うことで、確実に望ましい
標準パタン区間を取り出すことに第一の特徴があり、音
声の汎用的特徴である短時間(フレーム)エネルギー(
パワー)のフレーム間での増減傾向および、あるいはま
たはホルマント周波数のフレーム間での遷移傾向を利用
して基準音声パタンを登録された音声パタンの遷移部の
位置対応を強制するところに第二の特徴がある。
〔発明の実施例〕
以下、本発明の一実施例について詳細に説明する。第1
図は本発明の一実施例を示したブロック図である。アナ
ログ値である登録音声1が人力されて、LPF(低域通
過フィルタ)、ADC(アナログ−ディジタル変換器)
2でサンプリングでの折り返えし雑音を除去されながら
ディジタル値へ変換される。次に音声分析部4で音声の
特徴パラメータが計算され、登録音声の特徴パタンや短
時間エネルギーが抽出され、特徴パタンメモリ9に一旦
格納される。特徴パラメータとしてはBPF(帯域通過
フィルタ群)の出力値やLPG (線形予測)分析結果
得られるパラメータなどがある。
得られた特徴パタンは対応位置検出部4と距離計算部5
へ入力される。対応位置検出部4ではさらに基準音声パ
タンか基準パタンメモリから読み込まれ、登録音声と基
準音声との一部分(たとえば母音部)の位置対応付は処
理がなされ、その結果が距離計算部5へ入力される。距
離計算部5では登録音声パタンと基準パタンメモリ10
から読み込まれた基準音声パタンとのフレーム間距離行
列が計算される。本実施例では登録音声パタンと基準音
声パタンの位置対応付けられた情報が距離計算に反映す
る構成を一例としている。フレーム間距離行列をもとに
照合部6では登録音声パタンと基準音声パタンとの最適
な対応付けがDPマツチング処理によって行なわれる。
この際、基準音声パタンに前もってマーク付けられた標
準パタン区間情報から登録音声パタン中のS準パタン区
間が対応づけられる1判定部7で、対応づけられた登録
音声中の標準パタン区間が判定され、特徴パタンメモリ
9から標準パタンを取り出し、標準パタンメモリ11に
格納される。以上の処理は制御部8で制御されながら実
行される。
第2図は音声分析部3の一実施例を詳細に示したもので
ある。実施例ではBPF分析をあげている。ディジタル
値に変換された登録音声X。は中心周波数と帯域幅の違
うに個のBPF群31゜32に入力される。本実施例で
は周波数分解能をあげるために2段のBPF417成と
している。
BPF31.32は2次のバターワース型フィルタとな
っており、加算器2個2乗算器4個、遅延器2個から溝
1戊庄れでいる。BPF出力の波形は絶対値(ABS)
33にて整流され、LPF34゜サンプリング器35さ
らにLPF36にて高域周波数成分をカットされながら
登録音声パタンX1(1;フレーム)が求められて、L
PFはBPF同様に周波数分解能をあげるために2段構
成となっており、LPF34.36はBPF31.32
同様の処理呪模のバターワース型となっている。
尚、L、 P Fの2段構成については、特願昭55−
1359111号「ディジタル低域通過濾波回路」に詳
紺に説明されている2本発明では音声分析部3の構成を
B P F分析としたが、LPG分析とすることもIJ
能である。この場合の実施例は文献” S paach
AnalySis ;lnd 5ynthasis b
y LinearPredjction or t、h
e 5peech V/ave” by B 、 S 
Atal  et、  al、Journal  of
  Ac+)uStic  5ocietyof AI
oerica、vol、50+p−p637〜655 
、1!171に詳細に説明されている。
第3図は本発明の特徴の一つである対応位置検出部4と
距荒計算部5の一実施例を詳細に示したものである。対
応位置検出部4では、5tB音声パタンX+ かまずホ
ルマント検出部41に入力され、フレームでのホルマン
ト(FIPF出カバタカパタンークとして検出される。
)が検出され、ホルマント遷移探索部42にてフレーム
間でのホルマントの遷移傾向が抽出される。次に基準音
声パタンy、のホルマント遷移傾向との似具合いが合致
度計算部43にて算出され、登録音声パタンのiフレー
ムと基準音声パタンのjフレームとの位置対応の情報W
 I Jが出力される。尚、ここでの処理の詳細に関し
ては特願昭59 257524号「音声認識装置」に説
明されている。距離計算部5では登録音声パタンX、と
基準音声パタンy、との絶対値距離dIJ d+a= l xt  yjl = Σl Xi++−
yhJlk=1 さら−に2つのパタンの位置対応付けを規定する重み係
数W I Jで変換された距離dlJ′d IJ’ =
 WIJ d IJ が計算される。ここでj、jは2つのパタンのフレーム
、にはBPFのチャネル数である。実施例では、2つの
特徴パタンXl+ y’とが各々フレームパタンレジス
タ51.52を介しながら人力され、減算部53でxk
l−ykJが算出、絶対値変換器54と1xkl−yk
JIが算出され、加算器55でに〜1からKまでの累積
が行なわれdiaが算出される。さらに、乗算器56で
重み係数W i 、+とd+、+どの乗算結果、d I
J′ が出力される。本発明の実施例では絶対値距離と
したが、LPG分析で得C)れる特徴パタン間の類似度
尺度も考えられる。
この場合の具体的実施例は文献” M ini mum
Predjctive Re5idual Pr1nc
iple Appliedto 5peech ROc
ognition” by F、 I takura 
atal。
IEEHTranq、on Acoustic、5pe
ech and 5j4na]Processin)(
、vol、 ASSP −23+ p、p、57〜72
 +Fed、75に詳細に説明されている。
第4図は照合部6の一実施例を詳細に示したも(7) 
T A ル。g)ilL:i特開昭55−2205号r
 連Q D P法」を改良した連続分割D P法を使っ
ており、詳細はミラ学会1溝演会論文誌3−2−9 (
358−3)「連続D I)マツチングに関する一考祭
」あるいはIEEE ICASSI)84予稿集p、p
、35.1.1〜35.1゜4 (1984)  ”5
peakOr −Independent Conne
ctedl)igit Recognition”  
に説明されている。連続分割DP法では基準パタンの一
部分にマーク付けられた区間と15JIパタンとの対応
関係がマツチングパスを逆トレースせずに導出できる。
登録パタンのiフレームと基準パタンの、フフレームの
フレーム間距離dlJをもとに累積距離DIJが次の漸
化式を使って算出される。 (第5図) 基準音声パタン中に、基準パタンとして欲しい区間1r
−j2のマーク付けがなされており、マツチングパス情
報L I Jから、il、j2に対応した3P9音声パ
タンの区間is、izが対応づけられる。非線形照合の
結果、2つのパタンの全体としての最適なマツチング対
応がり、Jの最小値を探索することで求まる。具体的に
は、1に市音声パタン(]−〜Jフレーム)に対応した
’dB音声パタン(13〜18フレーム)は、まず終点
j。を ie  (i 、 min r)+、+)のように求め
、L I J情報から始点is、さらにはペテ録音声中
で標準パタンとして望ましい区間情報it、 ixが求
まることになる。
照合部6の具体的な実施例は、2つのパタンの位置対応
づけを規定した結果のフレーム間距跪d IJ’ が、
フレーム距離レジスタ61を介して入力され、遅延メモ
リ62と中間累積距離格納メモ’J 67 ヲ用イテd
 ’ l−1+J−1ヤDt−1,s−z*Dt−t+
J−t* Dr−y−*a−1が記憶される。各々の情
報をもとに加算器63ではパス■のD l−1,J−2
+d l−1+j−1+加算器64ではパス■のDI−
2,4−1+dj−t+白が算出され、パス■のD t
 −s l J −tとともに比較器65で最小値が探
索される。さらに加算器66で2d’xが最小値に加算
され、中間累積圧、IIDIJが新たに求められる。こ
の結果は中間累積距離格納メモリ67に格納され、D、
+1+s+1の算出の情報となる。さらに、比較器65
で算出された最小値を与えるパス情報がパス対応メモリ
68に格納される9判定部7では、最小マツチング度探
索部71においてDIJの最小値を与えるjが検出され
、標準パタン区間検出部72でL I Jの情報をもと
に基準音声パタンにマーク付けられたJ1+ J2に対
応した登録音声パタンのii、i2が検出される。この
結果、登録音声パタンの区間it、izが制御部8を介
し、特徴パタン9から読み込まれ、標準パタンメモリ1
1に格納される。
以下、本発明を具体的に音声/aka/ に適応した結
果を第6図を用いて説明する。(1)W準パタン区間を
前もって(オフラインで)マーク付けられた基準音声パ
タンの波形とパワーを示したものである(本実施例では
子音区間を標準パタンの区間としており、四角形で囲ん
である)。この基準音声パタンと登録音声パタンとの対
応づけが本発明に使って行なわれる。(2)は2つのパ
タンの一部分の位置対応づけを規定しない従来の照合処
理による登録音声のセグメンテーション結果である。こ
の図から従来の方法では登録音声の子音区間を正確に取
り出していない(/に/が四角形の外である)のがわか
る。(3)は本発明の方式によって、先行母音/a/の
子音への出渡り部と後続1’U’ * / a /の子
音からの入り渡たり部の位置対応づけを規定する処理を
加えた場合の結果である。この図から正確に子音区間が
取り出せており、本発明の有効性が確認さ、hた。
〔発明の効果〕
本発明によれば、前もって基準γ?声パタンにマーク付
けられた区間に対応したく)録音前パタンでの区間が正
確に取り出せるので、精度の高い筒面単位の標準パタン
の自助作成が可能になる効果がある。
【図面の簡単な説明】
第】図は本発明の一実施例を示すブロック図、第2図は
%f声分析部の具体的一実施例を示す図、第3図は対応
位置検出部と距離計算部の具体的−・実施例を示す図、
第4図は照合部と判定部の具体的一実施例を示す回、第
5図は1<を合部で用いる連続分割D P法の原理を示
す図、第6図は本発明を音%’ / aka / に適
用した時の結果を示す図である。 4・・・対応位置検出部、5・・・距離計算部、6・・
・照合竿5 口 (/ツタを圭lθPマツ子シフ”1=)Iプう、ζス、
の大ゴρミytも・・°クン  エ C21t、”ljlノ良1吐ノ←4.すL−2こ−1。 ¥40 (177−74中プX、! 七% 、 S:グーンーに
+λ→←4□

Claims (1)

  1. 【特許請求の範囲】 1、前もつて標準パタンの単位にマーク付けられた情報
    を持つ基準パタンメモリを具備し、新規に標準パタンと
    して登録される音声の特徴パタンを抽出する第1の手段
    と、前記基準パタンメモリから読み出された基準音声パ
    タンと前記第1の手段から得られる登録音声の特徴パタ
    ンの一部分の位置対応を規定する第2の手段と、前記2
    つのパタン間の短時間(フレーム)特徴間距離を算出す
    る第3の手段と、前記第2、第3の手段とから得られた
    情報をもとに前記2つのパタンの時間方向の伸縮を許し
    たパタン間の照合を行う第4の手段と、第4の手段から
    得られる前記2つのパタンの最終位置対応から基準パタ
    ンに前もつて標準パタンの単位にマーク付けられた区分
    に対応して登録音声から新規の標準パタンを取り出し、
    標準パタンメモリに格納する第5の手段とを有すること
    を特徴とする音声標準パタン自動作成装置。 2、前記特許請求の範囲第1項記載の第2の手段は基準
    音声と登録された音声との短時間(フレーム)エネルギ
    ーのフレーム間の増減傾向および、あるいはまたは前記
    2つの音声のホルマント周波数のフレーム間の遷移傾向
    から前記基準音声パタンと登録音声パタンの遷移部の位
    置対応を行うことを特徴とする前記第1項記載の音声標
    準パタン自動作成装置。
JP60271481A 1985-12-04 1985-12-04 音声標準パタン自動作成装置 Expired - Lifetime JPH07111639B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60271481A JPH07111639B2 (ja) 1985-12-04 1985-12-04 音声標準パタン自動作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60271481A JPH07111639B2 (ja) 1985-12-04 1985-12-04 音声標準パタン自動作成装置

Publications (2)

Publication Number Publication Date
JPS62131299A true JPS62131299A (ja) 1987-06-13
JPH07111639B2 JPH07111639B2 (ja) 1995-11-29

Family

ID=17500642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60271481A Expired - Lifetime JPH07111639B2 (ja) 1985-12-04 1985-12-04 音声標準パタン自動作成装置

Country Status (1)

Country Link
JP (1) JPH07111639B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61219098A (ja) * 1985-03-25 1986-09-29 株式会社リコー 音韻パタ−ン登録方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61219098A (ja) * 1985-03-25 1986-09-29 株式会社リコー 音韻パタ−ン登録方式

Also Published As

Publication number Publication date
JPH07111639B2 (ja) 1995-11-29

Similar Documents

Publication Publication Date Title
EP0128755B1 (en) Apparatus for speech recognition
JPS58130393A (ja) 音声認識装置
JPS6128998B2 (ja)
JPS62131299A (ja) 音声標準パタン自動作成装置
JPH04163497A (ja) 音声区間検出方法
JP2664136B2 (ja) 音声認識装置
JPS613200A (ja) 音声認識装置
JP3015477B2 (ja) 音声認識方法
JPS61275799A (ja) 音声認識装置
JPS6368899A (ja) 音声認識装置
TUN et al. Development of Feature Extraction of Speech Recognition System for Security Control of the Confidential Information Areas
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPS59124390A (ja) 候補削減音声認識方式
JPS61267098A (ja) 音声認識装置
WO1991002348A1 (en) Speech recognition using spectral line frequencies
JPS61176996A (ja) 音声認識装置
JPS58139199A (ja) 音声自動認識装置
JPS6258517B2 (ja)
JPS61208097A (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPH0634181B2 (ja) 音声認識装置
JPS61137200A (ja) 音声認識方式
JPS6310440B2 (ja)
JPS62136700A (ja) 音声認識装置
JPS61176997A (ja) 音声認識装置