JPS6136798A - 音声セグメンテ−シヨン法 - Google Patents
音声セグメンテ−シヨン法Info
- Publication number
- JPS6136798A JPS6136798A JP15962684A JP15962684A JPS6136798A JP S6136798 A JPS6136798 A JP S6136798A JP 15962684 A JP15962684 A JP 15962684A JP 15962684 A JP15962684 A JP 15962684A JP S6136798 A JPS6136798 A JP S6136798A
- Authority
- JP
- Japan
- Prior art keywords
- distance
- segmentation
- frame
- parts
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、様々な命令やデータを音声によって入力する
ことを可能とする音声uR装置における音声セグメンテ
ーション法に関するものでらる。。
ことを可能とする音声uR装置における音声セグメンテ
ーション法に関するものでらる。。
従来例の構成とその問題点
単語音声を認識する方法として大きく分けて、単語全体
を単位としてパターンマツチングを行ない単語を認識す
る方法と、更に細かな音節あるいは音素の単位の認識を
行なった後で単語を認識する方法とがある。前者につい
ては、個人差による音声パターンの時間的変動や周波数
構造上の変動を吸収できる認識方式が必要であり、後者
については、音韻性のみを表わすパラメ・−夕を抽出す
るとともに音素あるいは音節毎にセグメンテーシ。
を単位としてパターンマツチングを行ない単語を認識す
る方法と、更に細かな音節あるいは音素の単位の認識を
行なった後で単語を認識する方法とがある。前者につい
ては、個人差による音声パターンの時間的変動や周波数
構造上の変動を吸収できる認識方式が必要であり、後者
については、音韻性のみを表わすパラメ・−夕を抽出す
るとともに音素あるいは音節毎にセグメンテーシ。
ンを行なうことが必要である。後者の方法を用いれば、
音素や音節の組み合わせによって、少ない標準パターン
でよシ多くの単語を扱うことができ、また単語辞書を更
新する都度標準パターンを変更しなければならないとい
う手間が省け、更に連続音声認識の場合についてもよシ
有効な処理を行なえるという長所がある反面、音素ある
いは音節毎にセグメンテーションを行なわなければなら
ないという難かしい問題を解決しなければならない。
音素や音節の組み合わせによって、少ない標準パターン
でよシ多くの単語を扱うことができ、また単語辞書を更
新する都度標準パターンを変更しなければならないとい
う手間が省け、更に連続音声認識の場合についてもよシ
有効な処理を行なえるという長所がある反面、音素ある
いは音節毎にセグメンテーションを行なわなければなら
ないという難かしい問題を解決しなければならない。
従来、音素を認識の単位とする音声認識における音素の
セグメンテーション方法として、多くのシステムが、先
ず有声・無声・無音の識別を行ない、しかる後に、有声
無声の各区間について更にそれぞれ一定の音響的特徴
を持った区間に細分するという方法を採っている。有声
・無声 無音の識別については、例えば、10m5程度
の区間(フレーム)毎の零交差回数、信号の対数エネル
ギー、1サンプル時間遅れの自己相関係数、線形予測係
数のZ の係数、線形予測残差の対数エネルギーをパラ
メータとし、パターン認識的手法によって識別を行なう
方法(B、 S、 Atal他:ムpattern r
ecognition approach t。
セグメンテーション方法として、多くのシステムが、先
ず有声・無声・無音の識別を行ない、しかる後に、有声
無声の各区間について更にそれぞれ一定の音響的特徴
を持った区間に細分するという方法を採っている。有声
・無声 無音の識別については、例えば、10m5程度
の区間(フレーム)毎の零交差回数、信号の対数エネル
ギー、1サンプル時間遅れの自己相関係数、線形予測係
数のZ の係数、線形予測残差の対数エネルギーをパラ
メータとし、パターン認識的手法によって識別を行なう
方法(B、 S、 Atal他:ムpattern r
ecognition approach t。
voteed −unvoiced −si 1enc
e classificationwith appl
ication to 5peech recogni
tion。
e classificationwith appl
ication to 5peech recogni
tion。
IEICE Trans、 Acoust、 、 5p
eech、 SignalProcegsing AS
SP −24−3(1976) )がある。
eech、 SignalProcegsing AS
SP −24−3(1976) )がある。
また、有声 無声・無音の識別とは別に、音声の低域パ
ワーと高域パワーのそれぞれのくぼみ(デ、イップ)の
大きさや変化の仕方を基に子音のセグメンテーションを
行なう方法(星見他:子音のセグメンテーション法、日
本音響学会講演論文集、l−1−1ta (Oct、
1983 )がある。これらの方法を併用することによ
シ、はとんどの子音について高率でセグメンテーション
することが可能である。しかし、母音のセグメンテーシ
ョンについては、母音の定常部や母音間の境界付近にお
ける特徴パラメータの安定性や変化の大きさを基にセグ
メンテーションを行なう方法や、セグメントとしての特
徴パラメータのまとまシのよさに着目してセグメンテー
ションを行なう方法などが考えられているが、調音結合
の影響で余分なセグメントが付加したシ、1つの母音が
複数のセグメントに分割されたシすることが多いため、
音素単位のマ、チングの際の誤りの原因となることが多
い。また、10 m11程度の区間(フレーム)毎の音
素標準パターンとのマツチング結果を基に記号化した後
、同じ記号を割シ当てられた区間を1つのセグメントに
まとめることによシセグメンテーションを行なう方法も
あるが、やはυ調音結合の影響は避けられない上、標準
パターンと入カバターンとのずれが大きい場合には、セ
グメンテーションが著しく狂ってしまうという欠点があ
った。
ワーと高域パワーのそれぞれのくぼみ(デ、イップ)の
大きさや変化の仕方を基に子音のセグメンテーションを
行なう方法(星見他:子音のセグメンテーション法、日
本音響学会講演論文集、l−1−1ta (Oct、
1983 )がある。これらの方法を併用することによ
シ、はとんどの子音について高率でセグメンテーション
することが可能である。しかし、母音のセグメンテーシ
ョンについては、母音の定常部や母音間の境界付近にお
ける特徴パラメータの安定性や変化の大きさを基にセグ
メンテーションを行なう方法や、セグメントとしての特
徴パラメータのまとまシのよさに着目してセグメンテー
ションを行なう方法などが考えられているが、調音結合
の影響で余分なセグメントが付加したシ、1つの母音が
複数のセグメントに分割されたシすることが多いため、
音素単位のマ、チングの際の誤りの原因となることが多
い。また、10 m11程度の区間(フレーム)毎の音
素標準パターンとのマツチング結果を基に記号化した後
、同じ記号を割シ当てられた区間を1つのセグメントに
まとめることによシセグメンテーションを行なう方法も
あるが、やはυ調音結合の影響は避けられない上、標準
パターンと入カバターンとのずれが大きい場合には、セ
グメンテーションが著しく狂ってしまうという欠点があ
った。
発明の目的
本発明は、従来のこのような問題に対し、標準パターン
のずれに依存しない、よシ付加の少ない母音セグメンテ
ーションを可能とするものである。
のずれに依存しない、よシ付加の少ない母音セグメンテ
ーションを可能とするものである。
発明の構成
本発明は上記目的を達成するもので、入力音声から分析
フレーム毎に抽出された特徴パラメータのフレーム相互
間の距離を基に音響的特性の安定な部分と不安定な部分
を抽出し、ある値よりも大きな距離を示す2つの不安定
部に挾まれた区間内に存在する安定部相互のパラメータ
距離を計算し、この結果に基づいて過分側されたセグメ
ントを分割し直し1つの音素区間としてセグメンテーシ
ョンすることを特徴とする音声セグメンテーション法を
提供するものである。
フレーム毎に抽出された特徴パラメータのフレーム相互
間の距離を基に音響的特性の安定な部分と不安定な部分
を抽出し、ある値よりも大きな距離を示す2つの不安定
部に挾まれた区間内に存在する安定部相互のパラメータ
距離を計算し、この結果に基づいて過分側されたセグメ
ントを分割し直し1つの音素区間としてセグメンテーシ
ョンすることを特徴とする音声セグメンテーション法を
提供するものである。
実施例の説明
以下本発明の一実施例について図面を参照しながら説明
する。第1図は本発明の一実施例における音声セグメン
テーション装置の構成を示す機能ブロック図である。本
実施例は、入力音声から分析フレーム毎に特徴パラメー
タを抽出する部分と、フレーム相互の特徴パラメータの
距離を基に音響的特性の安定な部分のピークと不安点な
部分のピークを求める部分と、2つの不安定部のピーク
に挾まれた区間の安定な部分のピークを中心として中心
間における特徴パラメータの距離を計算する部分と、ど
の2つの区間の中心間の距離も閾値を越えない場合、こ
れらを1つの音素区間としてセグメンテーシジンする部
分とを少なくとも有している。
する。第1図は本発明の一実施例における音声セグメン
テーション装置の構成を示す機能ブロック図である。本
実施例は、入力音声から分析フレーム毎に特徴パラメー
タを抽出する部分と、フレーム相互の特徴パラメータの
距離を基に音響的特性の安定な部分のピークと不安点な
部分のピークを求める部分と、2つの不安定部のピーク
に挾まれた区間の安定な部分のピークを中心として中心
間における特徴パラメータの距離を計算する部分と、ど
の2つの区間の中心間の距離も閾値を越えない場合、こ
れらを1つの音素区間としてセグメンテーシジンする部
分とを少なくとも有している。
第1図において、入力音声を分析フレーム毎に音響分析
した後の音声データaから特徴パラメータ抽出部1にお
いてフレーム毎にパワー、LPCケプストラム係数等の
特徴パラメータを抽出した後、子音セグメンテーション
部2において、パワーのディップの大きさと変化の仕方
を基に子音のセグメンテーションを行ない、残された母
音区間について特徴パラメータ抽出部1の結果を用い定
常性・非定常性検出部3においてフレーム間の特徴パラ
メータの距離または相関の値を基に音響的特性の安定な
部分と不安定な部分のピークを示すフV −ムを抽出し
、その結果をセグメント分割部4に転送する。次に特徴
パラメータ抽出部1の結果を用いて安定な部分のピーク
が検出されたフレーム相互間の特徴パラメータの距離を
距離計算部5によって計算し、その結果を基にセグメン
ト分割部4で距離の値が閾値を越えないものをまとめて
1つのセグメントとすることにより、セグメンテーショ
ンを行ない、その結果すを図示していない音素認識部へ
転送するという構成をとる。
した後の音声データaから特徴パラメータ抽出部1にお
いてフレーム毎にパワー、LPCケプストラム係数等の
特徴パラメータを抽出した後、子音セグメンテーション
部2において、パワーのディップの大きさと変化の仕方
を基に子音のセグメンテーションを行ない、残された母
音区間について特徴パラメータ抽出部1の結果を用い定
常性・非定常性検出部3においてフレーム間の特徴パラ
メータの距離または相関の値を基に音響的特性の安定な
部分と不安定な部分のピークを示すフV −ムを抽出し
、その結果をセグメント分割部4に転送する。次に特徴
パラメータ抽出部1の結果を用いて安定な部分のピーク
が検出されたフレーム相互間の特徴パラメータの距離を
距離計算部5によって計算し、その結果を基にセグメン
ト分割部4で距離の値が閾値を越えないものをまとめて
1つのセグメントとすることにより、セグメンテーショ
ンを行ない、その結果すを図示していない音素認識部へ
転送するという構成をとる。
以上のように構成された音声セグメンテーション装置に
ついて以下その動作について更に詳細に説明する。まず
、特徴パラメータ抽出部1では、入力音声データを12
KHzサンプリングし、10maの分析フレーム毎に1
6次のLPC分析を行ない、15次のLPCケプヌトラ
ム係数を求、める。一方、低域・高域のデジタルフィル
タを通過した音声データよりフレーム毎の低域パワー、
高域パワーを求める。次に、子音セグメンテーション部
2では主に、低域パワーと高域パワーそれぞれのディッ
プの大きさに基づいて子音のセグメンテーションを行な
う。この方法については本出願人の出願になる特願昭5
7−171632号および特願昭58−178547号
に述べであるので詳しい説明は省略する。
ついて以下その動作について更に詳細に説明する。まず
、特徴パラメータ抽出部1では、入力音声データを12
KHzサンプリングし、10maの分析フレーム毎に1
6次のLPC分析を行ない、15次のLPCケプヌトラ
ム係数を求、める。一方、低域・高域のデジタルフィル
タを通過した音声データよりフレーム毎の低域パワー、
高域パワーを求める。次に、子音セグメンテーション部
2では主に、低域パワーと高域パワーそれぞれのディッ
プの大きさに基づいて子音のセグメンテーションを行な
う。この方法については本出願人の出願になる特願昭5
7−171632号および特願昭58−178547号
に述べであるので詳しい説明は省略する。
次に、定常性・非定常性検出部3の動作を第2図を参照
しながら説明する。図において、横軸は時間(フレーム
)、縦軸は以下に示す距離の太きさを表わす。定常性・
非定常性の尺度6は時間的に離れた二つのフレーム間の
LPCケプストラム係数(pH(R=1.2.・・・・
・・16)のユークリッド距離 (mはフレーム番号)tたはフレーム間の相関S工を用
いた距離(相関距離と呼ぶ) am=1−sm 但し、 の荷重移動平均をとることによシ得られる。この定常性
・非定常性の尺度6よシ、母音区間毎に極大値をとるフ
レーム(極大フレーム)Qおよび極小値をとるフレーム
(極小フレーム)Pを検出し、極大値が予め決められた
閾値T、を越える毎に、極大フレームでセグメントの分
割を行ない、分割された区間内における極小フレームP
および極大フレームQをフレーム番号の小さいものから
順にP□(i = 1 、2、−・−、n ; n :
極小フレームの出現数)、Qj(j=1.2.・・・・
・・、n−1)但しP+ < Q+ < P2 <Q2
−・・Qn−1< Pnとしてセグメント分割部4へ転
送する。ここでセグメント分割部4の動作を説明する前
に距離計算部5の動作を説明しておく。距離計算部6で
は、セグメント分割部4から指定されたPiフレームと
Piフレームとの特徴パラメータの距離d(i、i)を
LPCケプストラム係数のユークリッド距離 またはフレーム間の特徴パラメータの相関8(i、j)
よシ求めた d (i、j) =1− s(i、j)等を用いて計算
する。また、閾値Tl)は、PiとPj間のフレーム数
に応じて変えられるようにしておく。次にセグメント分
割部4の動作を第3図を参照しながら説明する。定常性
・非定常性検出部3よシ転送された極小フレームPl(
i=1.2.・・・・・・。
しながら説明する。図において、横軸は時間(フレーム
)、縦軸は以下に示す距離の太きさを表わす。定常性・
非定常性の尺度6は時間的に離れた二つのフレーム間の
LPCケプストラム係数(pH(R=1.2.・・・・
・・16)のユークリッド距離 (mはフレーム番号)tたはフレーム間の相関S工を用
いた距離(相関距離と呼ぶ) am=1−sm 但し、 の荷重移動平均をとることによシ得られる。この定常性
・非定常性の尺度6よシ、母音区間毎に極大値をとるフ
レーム(極大フレーム)Qおよび極小値をとるフレーム
(極小フレーム)Pを検出し、極大値が予め決められた
閾値T、を越える毎に、極大フレームでセグメントの分
割を行ない、分割された区間内における極小フレームP
および極大フレームQをフレーム番号の小さいものから
順にP□(i = 1 、2、−・−、n ; n :
極小フレームの出現数)、Qj(j=1.2.・・・・
・・、n−1)但しP+ < Q+ < P2 <Q2
−・・Qn−1< Pnとしてセグメント分割部4へ転
送する。ここでセグメント分割部4の動作を説明する前
に距離計算部5の動作を説明しておく。距離計算部6で
は、セグメント分割部4から指定されたPiフレームと
Piフレームとの特徴パラメータの距離d(i、i)を
LPCケプストラム係数のユークリッド距離 またはフレーム間の特徴パラメータの相関8(i、j)
よシ求めた d (i、j) =1− s(i、j)等を用いて計算
する。また、閾値Tl)は、PiとPj間のフレーム数
に応じて変えられるようにしておく。次にセグメント分
割部4の動作を第3図を参照しながら説明する。定常性
・非定常性検出部3よシ転送された極小フレームPl(
i=1.2.・・・・・・。
n)の数nが2以上であれば、以下の処理によりセグメ
ントの分割を行なう。
ントの分割を行なう。
1】 初期値をに=o、j=2として■)を行なう。
11)距離計算部6で計算したPl−1フレームとPi
フレームにおける特徴パラメータの距離d(i−1,i
)が閾値Tbを越えたらI)を行なう。閾値Tbを越え
なければに=に+1 。
フレームにおける特徴パラメータの距離d(i−1,i
)が閾値Tbを越えたらI)を行なう。閾値Tbを越え
なければに=に+1 。
1=1としてIV)を行なう(第3図a)。
1)Pi−+フレームとPi 7レームの間のqi−1
フレームでセグメントを分割し、i=i+1として1が
nを越えなければに=oとしてl)を行ない、nを越え
れば処理を終了する。
フレームでセグメントを分割し、i=i+1として1が
nを越えなければに=oとしてl)を行ない、nを越え
れば処理を終了する。
1v)k−1なら11)を行なう。k)1なら、距i計
算部6で計算したPl−1フレームとPiフレームにお
ける特徴パラメータの距離d(i−j、i)が閾値Tb
を越えればPi 3とPlまでの間で分割するものとし
てVl)を行ない、閾値Tbを越えなければV)を行な
う(第3図b)。
算部6で計算したPl−1フレームとPiフレームにお
ける特徴パラメータの距離d(i−j、i)が閾値Tb
を越えればPi 3とPlまでの間で分割するものとし
てVl)を行ない、閾値Tbを越えなければV)を行な
う(第3図b)。
v)j=kになればn)を行なう。j<kならi =
i+1としてlv)を行なう。
i+1としてlv)を行なう。
vl) 距離計算部6で計算したPl−5フレームと
Pi−、フレームにおける特徴パラメータの距離d(i
−j 、 i −1)とPi−j++フレームとPiフ
レームにおける特徴パラメータの距離d(i−j+1.
i)の値を比較して、値の大きい方の区間内で分割する
ものとし、 d(i−1+1,1)(d(i−1,1−1)ならlを
1−1とする。このときl=2であれば分割する区間は
一意に定まるからII)を行なう。j>2であれば1=
i−1としてvl)を行なう(第3図C)。
Pi−、フレームにおける特徴パラメータの距離d(i
−j 、 i −1)とPi−j++フレームとPiフ
レームにおける特徴パラメータの距離d(i−j+1.
i)の値を比較して、値の大きい方の区間内で分割する
ものとし、 d(i−1+1,1)(d(i−1,1−1)ならlを
1−1とする。このときl=2であれば分割する区間は
一意に定まるからII)を行なう。j>2であれば1=
i−1としてvl)を行なう(第3図C)。
第4図a、bに以上述べた1)−1V)までの手順をフ
ローチャートにして示す。
ローチャートにして示す。
最後に、以上によって得られた子音および母音区間のセ
グメンテーション結果すを音素認識部へ転送する。
グメンテーション結果すを音素認識部へ転送する。
このように、本実施例は音響的特性の定常部を抽出踵そ
の中心間の距離が閾値を越えないものをまとめ、また、
非定常部における変化が小さいものでも定常部中心間の
距離の大きいものに対してはセグメントに分割すること
によシ、従来、過分割される傾向にあったセグメンテー
ションを修正し、よシ付加の少ない母音セグメンテーシ
ョンを可能とするものである。
の中心間の距離が閾値を越えないものをまとめ、また、
非定常部における変化が小さいものでも定常部中心間の
距離の大きいものに対してはセグメントに分割すること
によシ、従来、過分割される傾向にあったセグメンテー
ションを修正し、よシ付加の少ない母音セグメンテーシ
ョンを可能とするものである。
本実施例によるセグメンテーションの具体例ヲ第6図に
示す。第5図aは、母音/a/の区間について、定常性
・非定常性尺度7のピークのみを用いてセグメンテーシ
ョンすると過分割セグメント8に示すように複数のセグ
メントに分割されてしまったものを、本発明による極小
フレーム間の特徴パラメータの距離d(1,2)、d(
2,3)。
示す。第5図aは、母音/a/の区間について、定常性
・非定常性尺度7のピークのみを用いてセグメンテーシ
ョンすると過分割セグメント8に示すように複数のセグ
メントに分割されてしまったものを、本発明による極小
フレーム間の特徴パラメータの距離d(1,2)、d(
2,3)。
d(1,3)がいずれもセグメンテーションの閾値Tb
以下であるという情報を利用して正しいセグメンテーシ
ョン結果9を得ることができた例である。また、上記の
ような過分割セグメントを減らすために定常性・非定常
性尺度の極大フレーム検出の際にピークの大きさによる
制限を設けて小さな極大フレームは検出しないようにし
た場合、音響的特徴が音素境界付近で比較的ゆるやかに
変化するような音素系列についてはしばしばセグメンテ
ーションされずに音素の脱落を生じてしまう。
以下であるという情報を利用して正しいセグメンテーシ
ョン結果9を得ることができた例である。また、上記の
ような過分割セグメントを減らすために定常性・非定常
性尺度の極大フレーム検出の際にピークの大きさによる
制限を設けて小さな極大フレームは検出しないようにし
た場合、音響的特徴が音素境界付近で比較的ゆるやかに
変化するような音素系列についてはしばしばセグメンテ
ーションされずに音素の脱落を生じてしまう。
第6図すは母音/ao/の区間について、定常性・非定
常性尺度10では/a/と10/の境界付近で検出した
極太ピークの値が小さかった場合でも1、本実施例によ
る極小フレーム間の距離d(1,2)が閾値Tbを越え
るという情報を利用して正しいセグメンテーション結果
を得ることができた例である。このように、本実施例は
、従来過分側される傾向にあったセグメンテーション方
法に対し、音素標準パターンのような話者が異なる場合
の変動要素の大きいものに頼らずにより付加の少ない信
頼性のあるセグメンテーションを行なうことを可能とし
、したがって、音素認識以後の単語マツチング処理につ
いてもより信頼度の高いマツチングが行なえるため、単
語認識率も改善されるという効果がおる。
常性尺度10では/a/と10/の境界付近で検出した
極太ピークの値が小さかった場合でも1、本実施例によ
る極小フレーム間の距離d(1,2)が閾値Tbを越え
るという情報を利用して正しいセグメンテーション結果
を得ることができた例である。このように、本実施例は
、従来過分側される傾向にあったセグメンテーション方
法に対し、音素標準パターンのような話者が異なる場合
の変動要素の大きいものに頼らずにより付加の少ない信
頼性のあるセグメンテーションを行なうことを可能とし
、したがって、音素認識以後の単語マツチング処理につ
いてもより信頼度の高いマツチングが行なえるため、単
語認識率も改善されるという効果がおる。
発明の効果
以上要するに本発明は、入力音声よシフレーム毎に音響
的特性の安定な部分と不安定な部分を抽出し、2つの不
安定部に挾まれた区間内に存在する安定部相互のパラメ
ータ距離の値に基づき過分側されたセグメントを1つの
音素区間としてセグメンテーションすることを特徴とす
る音声セグメ/チー7ヨン法を提供するもので、従来よ
シ付加の少ない信頼性の高い母音セグメンテーションが
行える利点を有する。
的特性の安定な部分と不安定な部分を抽出し、2つの不
安定部に挾まれた区間内に存在する安定部相互のパラメ
ータ距離の値に基づき過分側されたセグメントを1つの
音素区間としてセグメンテーションすることを特徴とす
る音声セグメ/チー7ヨン法を提供するもので、従来よ
シ付加の少ない信頼性の高い母音セグメンテーションが
行える利点を有する。
第1図は本発明の一実施例における音声セグメンテーシ
ョン装置の構成を示すプロ、り図、第2図は第1図にお
ける定常性・非定常性検出部3の動作を説明するための
図、第3図a % Oは第2図におけるセグメント分割
部4の動作を説明するための図、第4図a、bは第2図
におけるセグメント分・割部4の動作の70−チャート
、第5図a。 bは本発明によるセグメンテーションの具体例を示す図
である。 1・・・・・・特徴パラメータ抽出部、2・・・・・・
子音セグメンテーション部、3・・・・・・定常性・非
定常性検出部、4・・・・・・セグメント分割部、6・
・・・・・距離計算部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 第2図 b 3図 d(i−r、 j)ミTb (a) IC) 第4図 tcL) 第4図 (b)
ョン装置の構成を示すプロ、り図、第2図は第1図にお
ける定常性・非定常性検出部3の動作を説明するための
図、第3図a % Oは第2図におけるセグメント分割
部4の動作を説明するための図、第4図a、bは第2図
におけるセグメント分・割部4の動作の70−チャート
、第5図a。 bは本発明によるセグメンテーションの具体例を示す図
である。 1・・・・・・特徴パラメータ抽出部、2・・・・・・
子音セグメンテーション部、3・・・・・・定常性・非
定常性検出部、4・・・・・・セグメント分割部、6・
・・・・・距離計算部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 第2図 b 3図 d(i−r、 j)ミTb (a) IC) 第4図 tcL) 第4図 (b)
Claims (4)
- (1)入力音声よりフレーム毎に音響的特性の安定部と
不安定部を抽出し、安定部相互のパラメータ距離の値に
基づき過分割されたセグメントをまとめ、不安定部を境
界としてセグメンテーションを行うことを特徴とする音
声セグメンテーション法。 - (2)安定部相互のパラメータ距離の値を基に過分割さ
れたセグメントをまとめる手段として、複数のセグメン
トのどの2つの安定部間のパラメータ距離も決められた
閾値を越えなければその中に含まれる全てのセグメント
を1つにまとめるという規則を持つことを特徴とする特
許請求の範囲第1項記載の音声セグメンテーション法。 - (3)安定部相互のパラメータ距離の値をLPCケプス
トラム係数のユークリッド距離を用いて計算することを
特徴とする特許請求の範囲第1項または第2項記載の音
声セグメンテーション法。 - (4)安定部相互のパラメータ距離の値をLPCケプス
トラム係数の相関距離を用いて計算することを特徴とす
る特許請求の範囲第1項または第2項記載の音声セグメ
ンテーション法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15962684A JPS6136798A (ja) | 1984-07-30 | 1984-07-30 | 音声セグメンテ−シヨン法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15962684A JPS6136798A (ja) | 1984-07-30 | 1984-07-30 | 音声セグメンテ−シヨン法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6136798A true JPS6136798A (ja) | 1986-02-21 |
Family
ID=15697827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15962684A Pending JPS6136798A (ja) | 1984-07-30 | 1984-07-30 | 音声セグメンテ−シヨン法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6136798A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5699673A (en) * | 1993-12-24 | 1997-12-23 | Kabushiki Kaisha Toyoda Jidoshokki Seisakusho | Compressed dry air supply system |
JP2005241997A (ja) * | 2004-02-26 | 2005-09-08 | Sega Corp | 音声解析装置、音声解析方法及び音声解析プログラム |
-
1984
- 1984-07-30 JP JP15962684A patent/JPS6136798A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5699673A (en) * | 1993-12-24 | 1997-12-23 | Kabushiki Kaisha Toyoda Jidoshokki Seisakusho | Compressed dry air supply system |
JP2005241997A (ja) * | 2004-02-26 | 2005-09-08 | Sega Corp | 音声解析装置、音声解析方法及び音声解析プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0128755B1 (en) | Apparatus for speech recognition | |
JPS5972496A (ja) | 単音識別装置 | |
JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
Natarajan et al. | Segmentation of continuous Tamil speech into syllable like units | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
JPS6336678B2 (ja) | ||
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS6069695A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
JPH0120440B2 (ja) | ||
JPS6293000A (ja) | 音声認識方法 | |
JPS63213900A (ja) | 破裂子音識別方式 | |
JPS6068393A (ja) | 音素判別方法 | |
JPS63155098A (ja) | 有声破裂音破裂時点検出装置 | |
JPH0114600B2 (ja) | ||
JPS61180300A (ja) | 音声認識装置 | |
JPH0455520B2 (ja) | ||
JPS5885495A (ja) | 音声認識装置 | |
JPS6120998A (ja) | 音声認識装置 | |
JPS6355599A (ja) | 音声認識装置 | |
JPH03145167A (ja) | 音声認識方式 | |
JPH0451039B2 (ja) | ||
JPS60147799A (ja) | 音声認識方法 | |
JPS6310437B2 (ja) | ||
JPH0451036B2 (ja) |