JPS61275896A - パタン区分装置 - Google Patents

パタン区分装置

Info

Publication number
JPS61275896A
JPS61275896A JP60117922A JP11792285A JPS61275896A JP S61275896 A JPS61275896 A JP S61275896A JP 60117922 A JP60117922 A JP 60117922A JP 11792285 A JP11792285 A JP 11792285A JP S61275896 A JPS61275896 A JP S61275896A
Authority
JP
Japan
Prior art keywords
section
interval
subsequent
similarity
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60117922A
Other languages
English (en)
Inventor
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60117922A priority Critical patent/JPS61275896A/ja
Publication of JPS61275896A publication Critical patent/JPS61275896A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声認識に関し、特に音韻情報の抽出に関す
るものである。
〔従来の技術〕
音韻(phoneme )とは言語の音声の中で区分で
きる小さな単位を言い、たとえば英語のtap中のp音
はtab 、 tagからtapを区別する音でちゃ、
従って言語tapが発音された音声の中からp音の部分
だけ全抽出することができる筈であり、このような部分
を音韻と言い、音韻情報の抽出は音声認識において重要
な処理である。
一方、音声パタンという概念があるが、音声のアナログ
信号を短い時間ΔTごとに区切り、この区切ったΔTの
間の音声信号をフIJ  IJ工分析して、各区切りの
中の周波数スペクトル全代表する特徴ベクトルの時系列
によって音声パタンを表している。したがって音韻区間
は音声パタンの特徴ベク   ゛トルの時系列の中の比
較的定常な区間として定戎することができる。
音声パタンを音韻区間ごとに区分する区分装置は、従来
は音声パタンを表す特徴ベクトル系列の中で一定の時間
(ΔTの整数倍の時間)だけ離れた2つの特徴ベクトル
の間の距離全算出し、これを時間変化量と称し、この時
間変化量が所定の値を超えかつ極大となる時点をもって
音韻区間の境界とし、それによって音声パタン全区分す
るように構成されていた。
〔発明が解決しようとする問題点〕
従来の装置は以上のように構成されているので、母音か
ら母音へ、あるいは母音から半母音へ等の場合のように
、周波数スペクトルの変化が時間的に緩やかな音韻区間
の境界に対しては、時間変化量が小さく、その境界を確
実に検出することが困難であるという問題点があった。
この発明は上記のような問題点を解決するためになされ
たもので、スペクトルの変化の緩急に依存することなく
確実に音韻区間の境界を検出することができる音声パタ
ンの区分装置を提供することを目的としている。
〔問題点を解決するための手段〕
この発明ではΔT区間ごとの特徴ベクトルの時系列によ
って構成される音声パターンから出発して、互に類似し
た特徴ベクトルが時系列的に隣接している部分はこれを
結合して大きな(ΔTの整数倍の)区間の特徴ベクトル
に変更し、このような結合と変更を順次進めて次第に大
きな区間へと拡張してゆき、もはや隣接している部分へ
は結合できない程度の類似度となって残った特徴ベクト
ルの区間を音韻区間とした。
〔作用〕
特徴ベクトルの類似によって互に隣接した小区間を順次
結合して区間を大きくしてゆくので、時間変化量が小さ
な境界でもこれを検出することができる。
〔実施例〕
以下この発明の実施例を図面について説明する。
第1図はこの発明の一実施例を示すブロック図で、図に
おいて(1)は音声入力、(2)は分析部、(3)は区
分部、(4)は初期値設定部、(5)は出力部、(6)
は出力である。
分析部(2)はA/l) (アナログ・ディジタル)変
換器(以下A/I)と略記するX21)、周波数分析部
(22)、特微量計算部(23)、特徴ベクトルメ七I
J (24)から構成され、区分部(3)は計算部(3
1)、メモリ部(32)、探索部(33)、判定m1S
(34)、結合部(35)から悔成され、(341)は
終了信号で、(342)Vi結合信号である。
アナログ信号である音声入力(1)はA/D (21)
によりディジタル信号に変換され、このディジタル信号
はΔTの短い時間区間に区切られ、各区間ごとに周波数
分析部(22)によって周波数スペクトルが算出され、
この各区間ごとの周波数スペクトルが特微量計算部(2
3)によって対応する特徴ベクトルに変換され、この特
徴ベクトルの時系列が特徴ベクトルメモリ(24)に格
納される。
このようにして、特徴ベクトルメモリ(24) Kは、
−膜性をそこなうことなく、時間間隔ΔTffi単位と
して測った離散的な時刻について時刻1から時刻Nまで
の間のN個の特徴ベクトルが記憶される。
第2図はメモリ部(32)の初期値として初期値設定部
(4)の動作によって設定された内容を示すフォーマッ
ト図であって、図において(320)は1〜Nの区間番
号全示し、この区間番号(320)はこのメモリのアド
レスとして用いられ、(321)は区間の開始時刻、(
322)i、f区間の終了時刻、(323)は後続区間
番号、(324)Vi先行区間番号、(325)は後続
類似度である。初期状態において区間番号(320)に
対応する(321)〜(324)のデータは自ら決定さ
れているので計算部(31)から初期値設定部(4)に
よってメモリ部の各個に1き込むことができる。
後続類似度(325)欄には区間番号(32(])がi
である行にbIM(1s ’t) k算出した結果を書
込む。
SIM(i、fi)は第五区間とその後続の第fi区間
の間の類似度を表す数値で、これは計算部(31)によ
り次のようにして1出される。
すなわち、区間番号iが与えられると第2図の内容から
81r e を及びiに対する後続の区間fiに関する
”i ” fiが読出されるのでここで、X、Vi特徴
ベクトルメモリ(24)の第j番目に記憶されている特
徴ベクトルであり、フ、、7 はそれぞれ第五区間及び
第fi  区間にI    fl おける特徴ベクトルの平均特徴ベクトルである。
初期状態において△T ごとの特徴ベクトルが計算され
て特徴ベクトルメモ17 (24)に格納されていて、
第2図における各データのサフィクスの数字はΔT=1
とした値に対応するので、初期状態においては81 ”
” 81+ ef t−Bf t =ei +1テアリ
、式fll 、 [2)Uそれぞれμ、= Xi μf
i = ui+1なお、初期状態ではΔTごとに区外さ
れた第1乃至第NのN区分が存在するので、このような
状態を最大区分状態という。
計算部は式fil 、 +21による計算全路った後S
IM(i 、 fi ) =−CBDIS(μi、μf
i )・・・(3)の計算によってSIM(i、fi)
’r算出し、第2図区間番号iの行の後続類似度(32
5)欄にRiとして書き込む。但しCBDIS(μi、
μfi)は2つの平均特徴ベクトルμiとμfi  間
の市街地距離である。但し初期状態では−CBDIS(
μm、μH)=−CBDIS(xi、xi+□)である
以上のようにして最大区分状態がメモリ部(32)に記
憶されるが、次にVi順次2つの区分子f:1つの区分
に結合して区分数を減少してゆく。
すなわち、探索部(33)はメモリ部(32) Th探
索し、後続類似度(325)が最大である区間番号(3
2(1) mとその後続類似度(325) Rm  を
出力する。
判定部(34)はあらかじめ設定されている後続類似度
の閾値δとRm  とを比較し、Rm≧δ のとき結合
信号(342)を区間番号mと共に結合部(35)に送
り、Rm<δのとき終了信号(341)全出力部(5)
に送る。
結合信号(342)が発せられると区間番号fm(初期
状態から開始きれたときはfm−m十l)の区分が区間
番号mの区分に結合され、区分数は最大区分状態から1
区分だけ減少する。結合部(35)はこの結合の結果中
じた状態に従ってメモリ部(32)の内容を更新する。
すなわち、区間番号mの終了時刻emKもとのefmO
値を書き込み、区間番号mの後続区間番号としてffm
 (もとの区間番号fmの後続区間番号であった)を書
き込む3、更に、区間番号かもとのfmの後続区間番号
であった区間番号ffmの先行区間番号bf fmと1
〜で区間番号m11g:き込む(書き込み前はbffm
はfmであった)。
第2図に示すメモリ部(32)の内容を読み出すときは
、区間番号(320)がアドレスとして、区間番号(3
20)に該当する行のデータが読み出されるが、区間番
号(320)の初期値は1にセットされ、読出されたデ
ータの後続区間番号(323)欄の数値が次に読み出さ
れるアドレスとなる。初期状態において区間番号mの後
続類似度が最大であって、区間番号m+1の区分が区間
番号mの区分に結合された稜で、rn’にアドレスとし
て第2図のメモリ部(32)を読み出したとき、その後
続区間番号(323)欄にはm+2が格納されているの
で、次はm+2’J7アドレスとしてメモリ部(32)
が読出されることになり、区間番号m+1のデータは消
去されたのと同様になる。
以上のようにして区間番号mの区分の長さが変更される
とその平均特徴ベクトルμ も変化する。
式(1)により新しいμm を求める。区間番号mに後
続する後続区間にもとのfmからもとのffm(現在の
fm)に変化したが、この後続区間は区分が変化してな
いからその平均特徴ベクトルは変化せず特徴ベクトルメ
モIJ (24>から狩1み出すことができる。これを
μfmとすると計算部(31)は式(3)によりSIM
 (m、 fm ) = −CBDI S(1’m、/
’fm )を算出して区間番号mの行の後続類似度(3
25)の値を更新する。
更に、区間番号mの開始時刻Smがsl(すなわち区間
番号mが一連の区間連鎖の先頭)でなければ、bm 区
間の後続類似度も変化しているので、これ金穴(3)に
よって算出して佼@類似度(325)欄に沓込む。
以上により結合後のメモリ部(32)の更新処理が終了
する。次は更新されたメモリ部について後続類似度が最
大である区間番号(320)とその後続類似度を探索し
、更に結合を行って区分を一区分減少し、このようにし
て終了信号(341)が出力される葦で結合を繰返して
ゆく。
終了信号(34)が出力された時点で、メモリ部(32
) k、アドレスの初期値を1とし、その後は、後続区
間番号(323)の数値をアドレスとして順次読み出し
てゆけば、求める音韻区分が出力部(5)から出力(6
)として出力される。
以上の説明において式(3)のかわりに第m区間と第を
区間の類似度として j) ・・・(4) の計算式を用いてもよく、 のように、第m区間およびt区間の特徴ベクトルの間の
市街地距離の最大値を用いて計算することもできる。
また、特徴ベクトルの間の距離として市街地側離でなく
他のたとえばユークリッド距me用いることもできる。
以上は、特徴ベクトルの時系列で表された音声パタン全
区分する場合について説明したが、特徴ベクトルの時系
列として表される他のパタン、たとえば画像パタンにつ
いてもこの発明を適用することができる。
〔発明の効果〕
以上のようにこの発明によれば、最大区分状態から出発
して類似度の高い区分を順次結合してゆ   ゛き、音
韻区分の境界を見出すようにしたので、スペクトルの変
化の緩急に依存しないで、音韻区分の境界を検出でき、
音声認識装置等音韻特徴の正確な抽出を必要とする装置
の性能を格段に向上することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
は第1図のメモリ部の内容を示すフォーマット図である
。 (】)は音声入力、(23)は特徴量it1′算部、(
24)は特徴ベクトルメモリ、(31)は計り部、(3
2)はメモリ部、(33)は探索部、(34)Vi判定
部、(341) &TI終了信号、(342)は結合1
ぎ号、< 35 ) Vi結合部、(4)は初ル」値設
定部、(5)は出力部、(32(1)は区間番牲、(3
21)は開始時刻、(322)は終了時刻、(323)
は後れ区間番号、(324)は先行区間番号、(325
)は後続類似度。

Claims (1)

  1. 【特許請求の範囲】 アナログ信号を入力して、所定の時間間隔ΔTごとに区
    分した各区間に対し、当該区間のアナログ信号の特徴ベ
    クトルを算出する特徴量計算部、この特徴量計算部で算
    出した特徴ベクトルの時系列を記憶する特徴ベクトルメ
    モリ、 ΔTごとに区分した各区間に対する区間番号をアドレス
    として、当該区間の開始時刻、当該区間の終了時刻、当
    該区間に後続する区間の区間番号、当該区間に先行する
    区間の区間番号、当該区間と後続区間との類似度を表す
    後続類似度を記憶するメモリ部、 このメモリ部の各区間の開始時刻から終了時刻までの上
    記特徴ベクトルから当該区間の平均特徴ベクトルを算出
    し、ついで当該区間の平均特徴ベクトルと後続区間の平
    均特徴ベクトルとから上記後続類似度を算出する計算部
    、 ΔTごとに区分した区間の区分が全部存在する初期状態
    において、上記計算部で算出した後続類似度を用い、上
    記メモリ部の各欄にそれぞれの初期値を書込む初期値設
    定部、 上記メモリ部を探索し、メモリ部に記憶される後続類似
    度のうち最大の後続類似度を有する区間番号mを決定す
    る探索部、 この探索部が決定した上記最大の後続類似度があらかじ
    め定めた閾値以上であるときは結合信号と上記区間番号
    mを出力し、それ以外の場合は終了信号を出力する判定
    部、 上記結合信号が出力されたときは区間番号mの区分に、
    当該区分に後続する区分を結合し、この結合にともない
    区間番号mの区分の終了時刻、後続区間番号及びこの後
    続区間番号によって示される区分の先行区間番号を修正
    し、かつ上記計算部により区間番号mの区分の後続類似
    度及び区間番号mの区分の先行区分の後続類似度を新し
    く算出して上記メモリ部の内容を更新する結合部、この
    結合部における更新が終ったメモリ部を上記探索部で探
    索し、メモリ部に記憶される後続類似度のうち最大の後
    続類似度と、その最大の後続類似度を有する区間番号を
    決定し、この決定した最大の後続類似度が上記閾値以上
    であると上記判定部で判定したときは、上記結合部によ
    る結合を行って、その結合結果により上記メモリ部の内
    容を更新し、このようなメモリ部の内容更新、更新した
    内容に対する探索、探索結果の判定による結合、結合結
    果によるメモリ部の内容更新を、上記判定部における判
    定により終了信号が出力されるまで繰り返して実行する
    手段、 上記終了信号が出力された時点において上記メモリ部の
    結合結果による区分をパタン区分として出力する手段を
    備えたパタン区分装置。
JP60117922A 1985-05-31 1985-05-31 パタン区分装置 Pending JPS61275896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60117922A JPS61275896A (ja) 1985-05-31 1985-05-31 パタン区分装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60117922A JPS61275896A (ja) 1985-05-31 1985-05-31 パタン区分装置

Publications (1)

Publication Number Publication Date
JPS61275896A true JPS61275896A (ja) 1986-12-05

Family

ID=14723503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60117922A Pending JPS61275896A (ja) 1985-05-31 1985-05-31 パタン区分装置

Country Status (1)

Country Link
JP (1) JPS61275896A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020459A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 音声処理装置およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020459A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 音声処理装置およびプログラム

Similar Documents

Publication Publication Date Title
CN109389968B (zh) 基于双音节混搭的波形拼接方法、装置、设备及存储介质
CN110136689B (zh) 基于迁移学习的歌声合成方法、装置及存储介质
JPS5972496A (ja) 単音識別装置
JP3093113B2 (ja) 音声合成方法及びシステム
TW201822190A (zh) 語音辨識系統及其方法、詞彙建立方法與電腦程式產品
CN111105787B (zh) 一种文本匹配方法、设备及计算机可读存储介质
JP2006243673A (ja) データ検索装置および方法
US10572538B2 (en) Lattice finalization device, pattern recognition device, lattice finalization method, and computer program product
JPS61275896A (ja) パタン区分装置
JPH1152984A (ja) 音声認識装置における認識対象表示方式
JP3039453B2 (ja) 音声認識装置
JP2003228394A (ja) 音声入力を利用する名詞特定装置およびその方法
JPS6132679B2 (ja)
JP2738403B2 (ja) 音声認識装置
CN109740142A (zh) 一种字符串纠错方法及装置
US20230109867A1 (en) Speech recognition apparatus, control method, and non-transitory storage medium
JP2002064786A (ja) 映像分割方法および映像分割装置
EP2058799B1 (en) Method for preparing data for speech recognition and speech recognition system
CN116935895A (zh) 信息处理方法、装置、电子设备以及存储介质
JP2918380B2 (ja) 文字認識結果の後処理方法
JP2683976B2 (ja) 音声認識用確率モデル
CN117194998A (zh) 报文的关键字定位方法及装置
JPS62144200A (ja) 連続音声認識装置
JPS5978400A (ja) 候補列作成方式
CN118230718A (zh) 语言模型训练方法、系统、终端及介质