JPS58199399A - 音節抽出方式 - Google Patents
音節抽出方式Info
- Publication number
- JPS58199399A JPS58199399A JP57082632A JP8263282A JPS58199399A JP S58199399 A JPS58199399 A JP S58199399A JP 57082632 A JP57082632 A JP 57082632A JP 8263282 A JP8263282 A JP 8263282A JP S58199399 A JPS58199399 A JP S58199399A
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- similarity
- interval
- time
- vowel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
、(a)発明の技術分野
本発ψjは旨声認識装奮に係シ、特に一つ一つの音節の
特徴が明瞭に出る稈度にゆっくりと発声された文章を音
節単位に分割して認識するため、音節の境界を示す母音
及び撥音の検出を行なう音節抽出方式に関する。
特徴が明瞭に出る稈度にゆっくりと発声された文章を音
節単位に分割して認識するため、音節の境界を示す母音
及び撥音の検出を行なう音節抽出方式に関する。
(l)) 技術の背景
L]本語の文章を計算機に入力して処理する手3段とし
てa声を使用することは、それが自然な発声ンこよって
行々えるならば、 1)人間にとって最も自然であり、従って負担が最も軽
い、 22 人力連破もキーボード等の他の手段に比して速
い、 等の特徴を持ち、理想的な方法といえる。しかしながら
自然に発声された連続音声を音声認識装置にルtで認識
することは、各音韻の結着的特徴が前後の音しによって
影響を受ける調音結合の問題、各音■の特徴が必ずしも
明確に出ない吟の問題のため簡単には実現されそうもな
いのが現状である。
てa声を使用することは、それが自然な発声ンこよって
行々えるならば、 1)人間にとって最も自然であり、従って負担が最も軽
い、 22 人力連破もキーボード等の他の手段に比して速
い、 等の特徴を持ち、理想的な方法といえる。しかしながら
自然に発声された連続音声を音声認識装置にルtで認識
することは、各音韻の結着的特徴が前後の音しによって
影響を受ける調音結合の問題、各音■の特徴が必ずしも
明確に出ない吟の問題のため簡単には実現されそうもな
いのが現状である。
上記の如き連続音由の認識に於ける困難を避けるために
、日本語が単音節の連鎖として表わされることを利用し
て、音節単位に区シー1って発声する方法が考えられる
。こうすることにより音節の切り出し、調音結合の問題
が回避され、音節単位のパターン認識を行なえば良いこ
とになる。しかしこの方法は音節単位に息を止める会費
がおるため発声者に大きな負担がかかり、又入力速度も
遅くなると召う欠点があるだめ、その対策が望まれてい
る。
、日本語が単音節の連鎖として表わされることを利用し
て、音節単位に区シー1って発声する方法が考えられる
。こうすることにより音節の切り出し、調音結合の問題
が回避され、音節単位のパターン認識を行なえば良いこ
とになる。しかしこの方法は音節単位に息を止める会費
がおるため発声者に大きな負担がかかり、又入力速度も
遅くなると召う欠点があるだめ、その対策が望まれてい
る。
(c) 発明の目的
本発明の目的は上記安値に基づき必ずしも五節単位に息
を止めず(で各音節の%黴が余シ調廿結合の影響を受け
ない程度にゆっく9発声した文章を先ず音節単位に分割
し、その音節を識別することにより文章の認識を行なう
ようにするための音節の区分を示す母音又は撥音の区間
を検出する音節抽出方式を提供するととKある。
を止めず(で各音節の%黴が余シ調廿結合の影響を受け
ない程度にゆっく9発声した文章を先ず音節単位に分割
し、その音節を識別することにより文章の認識を行なう
ようにするための音節の区分を示す母音又は撥音の区間
を検出する音節抽出方式を提供するととKある。
(d) 発明の構成
本二3す3の構成は音節の特徴が出るようにゆっくり大
月きれた文章を音節単位に分割し、該音節を認識するこ
とにより文章の認識を行なう音声認識装置に於て、人力
背戸の各時刻に於ける瞬時電力と6−の特徴を衣わす量
を計算する手段と、該特徴蓋の時間笈化率を計算する手
段と、日本語の5母裕及び撥廿に対応する音韻の特徴績
を記憶する手段と、酌6己入力音声の特徴績と5母音及
び撥音の特徴績との類似度を計覧!する手段と、該類似
度i/J’最大となる一kf韻とその類似度を求める手
段とを設け、前記瞬時電力が一定値以上で且つ前記特徴
績の時間変イr率が一定値以下となる区間に於て、前記
ポ人@領度が一定値り、上となる音韻が同−音韻でIt
つ−(時間喝)上絵、続した場合、該音韻を一つの予4
筋の母音又は撥音の区間であると判定するようにしたも
のである。
月きれた文章を音節単位に分割し、該音節を認識するこ
とにより文章の認識を行なう音声認識装置に於て、人力
背戸の各時刻に於ける瞬時電力と6−の特徴を衣わす量
を計算する手段と、該特徴蓋の時間笈化率を計算する手
段と、日本語の5母裕及び撥廿に対応する音韻の特徴績
を記憶する手段と、酌6己入力音声の特徴績と5母音及
び撥音の特徴績との類似度を計覧!する手段と、該類似
度i/J’最大となる一kf韻とその類似度を求める手
段とを設け、前記瞬時電力が一定値以上で且つ前記特徴
績の時間変イr率が一定値以下となる区間に於て、前記
ポ人@領度が一定値り、上となる音韻が同−音韻でIt
つ−(時間喝)上絵、続した場合、該音韻を一つの予4
筋の母音又は撥音の区間であると判定するようにしたも
のである。
文章を音節即位に分割するには日本語の音節がlId’
ず一つの母音又は撥音を含むことを利用して、人ツバf
pの各時に1jに於ける瞬時”1と力が一定値以上で
hつ音韻の特徴績の時間変化率が一定値以下の区間に於
て、該人力音韻の特徴を表わす特徴パターンと日本語5
母音及び撥音に対応する音韻の標準パターンとの間の類
4iJ度をヤ神゛12、影入力tt口の特徴パターンの
計n値が予め定めたー餉より大きく月つ同−音韻であっ
て予め電めた継続時間以上伏いた。場合、該音韻は一つ
の音節の母音か父は検音の区間であると判定し7、それ
を基に召6()の切り出17を竹なうものである。
ず一つの母音又は撥音を含むことを利用して、人ツバf
pの各時に1jに於ける瞬時”1と力が一定値以上で
hつ音韻の特徴績の時間変化率が一定値以下の区間に於
て、該人力音韻の特徴を表わす特徴パターンと日本語5
母音及び撥音に対応する音韻の標準パターンとの間の類
4iJ度をヤ神゛12、影入力tt口の特徴パターンの
計n値が予め定めたー餉より大きく月つ同−音韻であっ
て予め電めた継続時間以上伏いた。場合、該音韻は一つ
の音節の母音か父は検音の区間であると判定し7、それ
を基に召6()の切り出17を竹なうものである。
(cl 発明の実施例
第1図は本発明の一実施例を示す回路のブロック図で第
2図は音y巾間を決定する過程を廓明する図であるC) マイクロホン等より入力された一11′P−は人力より
t++做轍及び電力計1憔1に入り、一定時間同一毎に
貼時電力と■旧iの特徴を表わす量(例えば短時間糸幅
スペクトルに対応する閂)が61獅され、特Cγ鯵時間
変化率泪算f、Q 2に送られ、註tf韻の特徴を表わ
す量が時間的にどの桟度侵化しでいるかを衣わす待望−
1時間変化率が計算さtするっ類似度81゛#L8p3
に入った一F記1d′+−3はメモ94に予め格納さ1
1ているア、イ ウ、毛オとンの5母音と敬廿の特似貝
と知−11,1度がgT jlされる。即ち入力音声の
音韻Q)荷微量と該5母昌及び恨音(V、後柳音は母音
に含む)の特g菫との距離が道内gf算され類似度が最
大になる音韻と、その時の蔵人類似度が求めらノLる。
2図は音y巾間を決定する過程を廓明する図であるC) マイクロホン等より入力された一11′P−は人力より
t++做轍及び電力計1憔1に入り、一定時間同一毎に
貼時電力と■旧iの特徴を表わす量(例えば短時間糸幅
スペクトルに対応する閂)が61獅され、特Cγ鯵時間
変化率泪算f、Q 2に送られ、註tf韻の特徴を表わ
す量が時間的にどの桟度侵化しでいるかを衣わす待望−
1時間変化率が計算さtするっ類似度81゛#L8p3
に入った一F記1d′+−3はメモ94に予め格納さ1
1ているア、イ ウ、毛オとンの5母音と敬廿の特似貝
と知−11,1度がgT jlされる。即ち入力音声の
音韻Q)荷微量と該5母昌及び恨音(V、後柳音は母音
に含む)の特g菫との距離が道内gf算され類似度が最
大になる音韻と、その時の蔵人類似度が求めらノLる。
第2図U l−ゴカッ」と発%lIL、た時の瞬時電力
と、経じ韻の母iとの最大類似度と、該最大類似度がど
の母音に&−jして得られたかと、該音韻の特徴蓋の時
間変イ1、率とを夫々時間@もの方向に展開して示して
いる。9は音塵波形をサンプリングし、た時の瞬時電力
の大きざを示(7、サンプリングの間隔7.;]へ′、
B5m5から30m5程度迄が用いられる。
と、経じ韻の母iとの最大類似度と、該最大類似度がど
の母音に&−jして得られたかと、該音韻の特徴蓋の時
間変イ1、率とを夫々時間@もの方向に展開して示して
いる。9は音塵波形をサンプリングし、た時の瞬時電力
の大きざを示(7、サンプリングの間隔7.;]へ′、
B5m5から30m5程度迄が用いられる。
+1rJ音ル検田レベルを定める閾値であシ、核間#
))上の電力が検出された区間が音声ン間である。10
は母召区間を検出するレベルを定める障1値で、該レベ
ル以上の瞬時電力の鞄く区間からルミをθ゛ri:すイ
)。12は前記サンプリング間隔で類似度言1算郡3に
より計算された各サンプリング、へらに於ける最大類似
度、即ち母音にm1人されている例えば/i/、/u/
l 10/吟の母−1からの類似度を示す包結線である
、13は母音区間を検出するレベルを定める閾値をりJ
モ’−75,Eり閾f111より大きい類似度の部分が
一定区間続くと、それが母音区間である。15は前記サ
ンプリング間隔で特徴皺時間変化率側算部2により計算
された特徴値が時間的に変化している特徴値時間変化率
を示す包結線である。子音は時間的に変化する量が大き
く、母音は時間的に変化する址が小さいo16は母音区
間を検出する閾値で、8?閾値より変化量の小さいb間
が母音8間である。
))上の電力が検出された区間が音声ン間である。10
は母召区間を検出するレベルを定める障1値で、該レベ
ル以上の瞬時電力の鞄く区間からルミをθ゛ri:すイ
)。12は前記サンプリング間隔で類似度言1算郡3に
より計算された各サンプリング、へらに於ける最大類似
度、即ち母音にm1人されている例えば/i/、/u/
l 10/吟の母−1からの類似度を示す包結線である
、13は母音区間を検出するレベルを定める閾値をりJ
モ’−75,Eり閾f111より大きい類似度の部分が
一定区間続くと、それが母音区間である。15は前記サ
ンプリング間隔で特徴皺時間変化率側算部2により計算
された特徴値が時間的に変化している特徴値時間変化率
を示す包結線である。子音は時間的に変化する量が大き
く、母音は時間的に変化する址が小さいo16は母音区
間を検出する閾値で、8?閾値より変化量の小さいb間
が母音8間である。
第1図に於て、類似度計算部3より送出烙れた信号は母
音区間決定部5に於て、音声の瞬時′Φ5カが母音区間
を検出する閾値より大きく、特徴R1’f1定化率が母
音区間を検出する閾イ山より小さく、[[つ最大類似度
が母音区間を検出する閾値より大きい区間に於て、同一
音韻が一外′時間経続するかどうか判定され上記朱件が
満場れた区間を母音区間と決定する。音節区間沃定部6
は母音区rHj決定部5の情報を基に一つの母音区間の
終シから次の母音区間の借り迄と、旨声[3−間の始め
から始めて;・k出6スまた1琺7J、 l〆1jiJ
のh1ζシ迄を一つの音節区間(。
音区間決定部5に於て、音声の瞬時′Φ5カが母音区間
を検出する閾値より大きく、特徴R1’f1定化率が母
音区間を検出する閾イ山より小さく、[[つ最大類似度
が母音区間を検出する閾値より大きい区間に於て、同一
音韻が一外′時間経続するかどうか判定され上記朱件が
満場れた区間を母音区間と決定する。音節区間沃定部6
は母音区rHj決定部5の情報を基に一つの母音区間の
終シから次の母音区間の借り迄と、旨声[3−間の始め
から始めて;・k出6スまた1琺7J、 l〆1jiJ
のh1ζシ迄を一つの音節区間(。
決定して音節1識部7へ送る。音節認識部7はt゛節標
準パターン格納部8よりの旨節僚準パターンとパターン
マツチングを行なって音節単位の認識を行ない、該音節
のつながりとして日本一文章がa3識される。
準パターン格納部8よりの旨節僚準パターンとパターン
マツチングを行なって音節単位の認識を行ない、該音節
のつながりとして日本一文章がa3識される。
?12し1にυ゛て、母音区間が・0乙/ a /、
、、u、/と3ケR「検出され、8声区間の始めよシ母
音区間、−’ o /の疼ミシ迄と、母音区間10/の
終りから母修区間/a/の4′ニジ迄と、音声18間の
始めより母音区間/u/の終シ迄の合計3ケの音節区間
が検出された事を肉−す。14は最大類似度が閾値を越
え撥if / n /とじて検出された事を示すが特徴
音P1間変化率では変化が大きく母音ではない事を示し
7ており、%微量時間変化率を用いることにより母音区
間検出の正確度が向上した事を示す。
、、u、/と3ケR「検出され、8声区間の始めよシ母
音区間、−’ o /の疼ミシ迄と、母音区間10/の
終りから母修区間/a/の4′ニジ迄と、音声18間の
始めより母音区間/u/の終シ迄の合計3ケの音節区間
が検出された事を肉−す。14は最大類似度が閾値を越
え撥if / n /とじて検出された事を示すが特徴
音P1間変化率では変化が大きく母音ではない事を示し
7ており、%微量時間変化率を用いることにより母音区
間検出の正確度が向上した事を示す。
(、f) Qす」の効果
jソ十明明した如く本発明は日本語が基本的に音節のつ
ながりから成り、その音節は撥音、単独はi、又は子音
十母音の組合せよシ成ることをオリ用しマー、−t’G
til」の9害′jを付:工っており、γCh:I認識
を何なえば文章を認識することが可能である。従って音
節の特徴が出る+′、度にゆつくシ発ルした文章を84
機に音声入力して処理!はせ得るため、@座者の共相を
増すこともなく、その効シ?は大なるものがある。
ながりから成り、その音節は撥音、単独はi、又は子音
十母音の組合せよシ成ることをオリ用しマー、−t’G
til」の9害′jを付:工っており、γCh:I認識
を何なえば文章を認識することが可能である。従って音
節の特徴が出る+′、度にゆつくシ発ルした文章を84
機に音声入力して処理!はせ得るため、@座者の共相を
増すこともなく、その効シ?は大なるものがある。
第1し1は本発明の一実施例を示す[す;路のブロック
M1第2図は音節区間を決定する。JJ程を説明する図
である。 1は特徴h・及び′−力iIt警部、2は特使飯時間変
化率計算部、3は類似度計算部、4はメモリ、5は母音
区間決定部、6は音節1メ間決定部 7は汁節認識部、
8は音節標準パターン格納部である。
M1第2図は音節区間を決定する。JJ程を説明する図
である。 1は特徴h・及び′−力iIt警部、2は特使飯時間変
化率計算部、3は類似度計算部、4はメモリ、5は母音
区間決定部、6は音節1メ間決定部 7は汁節認識部、
8は音節標準パターン格納部である。
Claims (1)
- 発声された文章を音節単位に分割し、該音節を闘識して
文章を認識する音声認識装置にがて、入力音声の各時刻
に於ける瞬時電力と音韻の特徴を表わす量を計算する手
段と核特微量の時間変化率を1算する手段と日本語の5
母音及び撥音に対応する音韻の特徴量を記憶する手段と
前記入力音声の特徴量と5母音及び撥音の特徴量との類
似度を計算する手段と一類似度が最大となる音韻とその
′類似度を求める手段とを設け、前記瞬時電力が一定値
以上で且つ前記特徴蓋の時間変化率が一定値以下となる
区間に於て、前記最大類似度が一定値以上となる音1が
同一音韻で且つ一定時間以上継続した場合、該音齢を一
つの音節の母音又は撥音の区間であると判定することを
特徴とする音節抽出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57082632A JPS58199399A (ja) | 1982-05-17 | 1982-05-17 | 音節抽出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57082632A JPS58199399A (ja) | 1982-05-17 | 1982-05-17 | 音節抽出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58199399A true JPS58199399A (ja) | 1983-11-19 |
Family
ID=13779810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57082632A Pending JPS58199399A (ja) | 1982-05-17 | 1982-05-17 | 音節抽出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58199399A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61180295A (ja) * | 1985-02-05 | 1986-08-12 | 富士通株式会社 | 連続音節認識方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5214562A (en) * | 1975-07-24 | 1977-02-03 | Kobe Steel Ltd | Device for off gauge treatment of metal strip coil |
-
1982
- 1982-05-17 JP JP57082632A patent/JPS58199399A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5214562A (en) * | 1975-07-24 | 1977-02-03 | Kobe Steel Ltd | Device for off gauge treatment of metal strip coil |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61180295A (ja) * | 1985-02-05 | 1986-08-12 | 富士通株式会社 | 連続音節認識方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Niebuhr et al. | Perception of phonetic detail in the identification of highly reduced words | |
JPS58130393A (ja) | 音声認識装置 | |
Yuan et al. | Investigating/l/variation in English through forced alignment | |
Karlsson et al. | Intonation adapts to lexical tone: the case of Kammu | |
Afroz et al. | Recognition and classification of pauses in stuttered speech using acoustic features | |
Zetterholm | Same speaker–different voices. A study of one impersonator and some of his different imitations | |
Safavi et al. | Identification of gender from children's speech by computers and humans. | |
Sinha et al. | Dialectal influences on acoustic duration of Hindi phonemes | |
Michaud et al. | Nasal release, nasal finals and tonal contrasts in Hanoi Vietnamese: an aerodynamic experiment | |
Bansal et al. | Emotional Hindi speech: Feature extraction and classification | |
JPS6138479B2 (ja) | ||
Maddieson | Articulatory Phonology and Sukuma" Aspirated Nasals" | |
JPS58199399A (ja) | 音節抽出方式 | |
Gunnar | Phonetic and phonemic basis for the transcription of Swedish word material | |
Huckvale | Word recognition from tiered phonological models | |
Hasegawa-Johnson et al. | On The Definition of the Word “Segmental” | |
Alotaibi et al. | A new look at the automatic mapping between Arabic distinctive phonetic features and acoustic cues | |
Zain et al. | A review of CALL-based ASR and its potential application for Malay cued Speech learning tool application | |
Raborife et al. | Developing a corpus to verify the performance of a tone labelling algorithm | |
JP2760096B2 (ja) | 音声認識方式 | |
Bhagath et al. | Acoustic phonetic approach for speech recognition: A review | |
JPH05173589A (ja) | 音声認識応答装置 | |
JPS6126099A (ja) | 音声基本周波数抽出方法 | |
JPS62299899A (ja) | よう音・直音言い分け評価方式 | |
JPS60164800A (ja) | 音声認識装置 |