JPS58199399A - 音節抽出方式 - Google Patents

音節抽出方式

Info

Publication number
JPS58199399A
JPS58199399A JP57082632A JP8263282A JPS58199399A JP S58199399 A JPS58199399 A JP S58199399A JP 57082632 A JP57082632 A JP 57082632A JP 8263282 A JP8263282 A JP 8263282A JP S58199399 A JPS58199399 A JP S58199399A
Authority
JP
Japan
Prior art keywords
syllable
similarity
interval
time
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57082632A
Other languages
English (en)
Inventor
純一 市川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57082632A priority Critical patent/JPS58199399A/ja
Publication of JPS58199399A publication Critical patent/JPS58199399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 、(a)発明の技術分野 本発ψjは旨声認識装奮に係シ、特に一つ一つの音節の
特徴が明瞭に出る稈度にゆっくりと発声された文章を音
節単位に分割して認識するため、音節の境界を示す母音
及び撥音の検出を行なう音節抽出方式に関する。
(l))  技術の背景 L]本語の文章を計算機に入力して処理する手3段とし
てa声を使用することは、それが自然な発声ンこよって
行々えるならば、 1)人間にとって最も自然であり、従って負担が最も軽
い、 22  人力連破もキーボード等の他の手段に比して速
い、 等の特徴を持ち、理想的な方法といえる。しかしながら
自然に発声された連続音声を音声認識装置にルtで認識
することは、各音韻の結着的特徴が前後の音しによって
影響を受ける調音結合の問題、各音■の特徴が必ずしも
明確に出ない吟の問題のため簡単には実現されそうもな
いのが現状である。
上記の如き連続音由の認識に於ける困難を避けるために
、日本語が単音節の連鎖として表わされることを利用し
て、音節単位に区シー1って発声する方法が考えられる
。こうすることにより音節の切り出し、調音結合の問題
が回避され、音節単位のパターン認識を行なえば良いこ
とになる。しかしこの方法は音節単位に息を止める会費
がおるため発声者に大きな負担がかかり、又入力速度も
遅くなると召う欠点があるだめ、その対策が望まれてい
る。
(c)  発明の目的 本発明の目的は上記安値に基づき必ずしも五節単位に息
を止めず(で各音節の%黴が余シ調廿結合の影響を受け
ない程度にゆっく9発声した文章を先ず音節単位に分割
し、その音節を識別することにより文章の認識を行なう
ようにするための音節の区分を示す母音又は撥音の区間
を検出する音節抽出方式を提供するととKある。
(d)  発明の構成 本二3す3の構成は音節の特徴が出るようにゆっくり大
月きれた文章を音節単位に分割し、該音節を認識するこ
とにより文章の認識を行なう音声認識装置に於て、人力
背戸の各時刻に於ける瞬時電力と6−の特徴を衣わす量
を計算する手段と、該特徴蓋の時間笈化率を計算する手
段と、日本語の5母裕及び撥廿に対応する音韻の特徴績
を記憶する手段と、酌6己入力音声の特徴績と5母音及
び撥音の特徴績との類似度を計覧!する手段と、該類似
度i/J’最大となる一kf韻とその類似度を求める手
段とを設け、前記瞬時電力が一定値以上で且つ前記特徴
績の時間変イr率が一定値以下となる区間に於て、前記
ポ人@領度が一定値り、上となる音韻が同−音韻でIt
つ−(時間喝)上絵、続した場合、該音韻を一つの予4
筋の母音又は撥音の区間であると判定するようにしたも
のである。
文章を音節即位に分割するには日本語の音節がlId’
ず一つの母音又は撥音を含むことを利用して、人ツバf
 pの各時に1jに於ける瞬時”1と力が一定値以上で
hつ音韻の特徴績の時間変化率が一定値以下の区間に於
て、該人力音韻の特徴を表わす特徴パターンと日本語5
母音及び撥音に対応する音韻の標準パターンとの間の類
4iJ度をヤ神゛12、影入力tt口の特徴パターンの
計n値が予め定めたー餉より大きく月つ同−音韻であっ
て予め電めた継続時間以上伏いた。場合、該音韻は一つ
の音節の母音か父は検音の区間であると判定し7、それ
を基に召6()の切り出17を竹なうものである。
(cl  発明の実施例 第1図は本発明の一実施例を示す回路のブロック図で第
2図は音y巾間を決定する過程を廓明する図であるC) マイクロホン等より入力された一11′P−は人力より
t++做轍及び電力計1憔1に入り、一定時間同一毎に
貼時電力と■旧iの特徴を表わす量(例えば短時間糸幅
スペクトルに対応する閂)が61獅され、特Cγ鯵時間
変化率泪算f、Q 2に送られ、註tf韻の特徴を表わ
す量が時間的にどの桟度侵化しでいるかを衣わす待望−
1時間変化率が計算さtするっ類似度81゛#L8p3
に入った一F記1d′+−3はメモ94に予め格納さ1
1ているア、イ ウ、毛オとンの5母音と敬廿の特似貝
と知−11,1度がgT jlされる。即ち入力音声の
音韻Q)荷微量と該5母昌及び恨音(V、後柳音は母音
に含む)の特g菫との距離が道内gf算され類似度が最
大になる音韻と、その時の蔵人類似度が求めらノLる。
第2図U l−ゴカッ」と発%lIL、た時の瞬時電力
と、経じ韻の母iとの最大類似度と、該最大類似度がど
の母音に&−jして得られたかと、該音韻の特徴蓋の時
間変イ1、率とを夫々時間@もの方向に展開して示して
いる。9は音塵波形をサンプリングし、た時の瞬時電力
の大きざを示(7、サンプリングの間隔7.;]へ′、
B5m5から30m5程度迄が用いられる。
+1rJ音ル検田レベルを定める閾値であシ、核間# 
))上の電力が検出された区間が音声ン間である。10
は母召区間を検出するレベルを定める障1値で、該レベ
ル以上の瞬時電力の鞄く区間からルミをθ゛ri:すイ
)。12は前記サンプリング間隔で類似度言1算郡3に
より計算された各サンプリング、へらに於ける最大類似
度、即ち母音にm1人されている例えば/i/、/u/
l 10/吟の母−1からの類似度を示す包結線である
、13は母音区間を検出するレベルを定める閾値をりJ
モ’−75,Eり閾f111より大きい類似度の部分が
一定区間続くと、それが母音区間である。15は前記サ
ンプリング間隔で特徴皺時間変化率側算部2により計算
された特徴値が時間的に変化している特徴値時間変化率
を示す包結線である。子音は時間的に変化する量が大き
く、母音は時間的に変化する址が小さいo16は母音区
間を検出する閾値で、8?閾値より変化量の小さいb間
が母音8間である。
第1図に於て、類似度計算部3より送出烙れた信号は母
音区間決定部5に於て、音声の瞬時′Φ5カが母音区間
を検出する閾値より大きく、特徴R1’f1定化率が母
音区間を検出する閾イ山より小さく、[[つ最大類似度
が母音区間を検出する閾値より大きい区間に於て、同一
音韻が一外′時間経続するかどうか判定され上記朱件が
満場れた区間を母音区間と決定する。音節区間沃定部6
は母音区rHj決定部5の情報を基に一つの母音区間の
終シから次の母音区間の借り迄と、旨声[3−間の始め
から始めて;・k出6スまた1琺7J、 l〆1jiJ
のh1ζシ迄を一つの音節区間(。
決定して音節1識部7へ送る。音節認識部7はt゛節標
準パターン格納部8よりの旨節僚準パターンとパターン
マツチングを行なって音節単位の認識を行ない、該音節
のつながりとして日本一文章がa3識される。
?12し1にυ゛て、母音区間が・0乙/ a /、 
、、u、/と3ケR「検出され、8声区間の始めよシ母
音区間、−’ o /の疼ミシ迄と、母音区間10/の
終りから母修区間/a/の4′ニジ迄と、音声18間の
始めより母音区間/u/の終シ迄の合計3ケの音節区間
が検出された事を肉−す。14は最大類似度が閾値を越
え撥if / n /とじて検出された事を示すが特徴
音P1間変化率では変化が大きく母音ではない事を示し
7ており、%微量時間変化率を用いることにより母音区
間検出の正確度が向上した事を示す。
(、f)  Qす」の効果 jソ十明明した如く本発明は日本語が基本的に音節のつ
ながりから成り、その音節は撥音、単独はi、又は子音
十母音の組合せよシ成ることをオリ用しマー、−t’G
til」の9害′jを付:工っており、γCh:I認識
を何なえば文章を認識することが可能である。従って音
節の特徴が出る+′、度にゆつくシ発ルした文章を84
機に音声入力して処理!はせ得るため、@座者の共相を
増すこともなく、その効シ?は大なるものがある。
【図面の簡単な説明】
第1し1は本発明の一実施例を示す[す;路のブロック
M1第2図は音節区間を決定する。JJ程を説明する図
である。 1は特徴h・及び′−力iIt警部、2は特使飯時間変
化率計算部、3は類似度計算部、4はメモリ、5は母音
区間決定部、6は音節1メ間決定部 7は汁節認識部、
8は音節標準パターン格納部である。

Claims (1)

    【特許請求の範囲】
  1. 発声された文章を音節単位に分割し、該音節を闘識して
    文章を認識する音声認識装置にがて、入力音声の各時刻
    に於ける瞬時電力と音韻の特徴を表わす量を計算する手
    段と核特微量の時間変化率を1算する手段と日本語の5
    母音及び撥音に対応する音韻の特徴量を記憶する手段と
    前記入力音声の特徴量と5母音及び撥音の特徴量との類
    似度を計算する手段と一類似度が最大となる音韻とその
    ′類似度を求める手段とを設け、前記瞬時電力が一定値
    以上で且つ前記特徴蓋の時間変化率が一定値以下となる
    区間に於て、前記最大類似度が一定値以上となる音1が
    同一音韻で且つ一定時間以上継続した場合、該音齢を一
    つの音節の母音又は撥音の区間であると判定することを
    特徴とする音節抽出方式。
JP57082632A 1982-05-17 1982-05-17 音節抽出方式 Pending JPS58199399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57082632A JPS58199399A (ja) 1982-05-17 1982-05-17 音節抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57082632A JPS58199399A (ja) 1982-05-17 1982-05-17 音節抽出方式

Publications (1)

Publication Number Publication Date
JPS58199399A true JPS58199399A (ja) 1983-11-19

Family

ID=13779810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57082632A Pending JPS58199399A (ja) 1982-05-17 1982-05-17 音節抽出方式

Country Status (1)

Country Link
JP (1) JPS58199399A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61180295A (ja) * 1985-02-05 1986-08-12 富士通株式会社 連続音節認識方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5214562A (en) * 1975-07-24 1977-02-03 Kobe Steel Ltd Device for off gauge treatment of metal strip coil

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5214562A (en) * 1975-07-24 1977-02-03 Kobe Steel Ltd Device for off gauge treatment of metal strip coil

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61180295A (ja) * 1985-02-05 1986-08-12 富士通株式会社 連続音節認識方法

Similar Documents

Publication Publication Date Title
Niebuhr et al. Perception of phonetic detail in the identification of highly reduced words
JPS58130393A (ja) 音声認識装置
Yuan et al. Investigating/l/variation in English through forced alignment
Karlsson et al. Intonation adapts to lexical tone: the case of Kammu
Afroz et al. Recognition and classification of pauses in stuttered speech using acoustic features
Zetterholm Same speaker–different voices. A study of one impersonator and some of his different imitations
Safavi et al. Identification of gender from children's speech by computers and humans.
Sinha et al. Dialectal influences on acoustic duration of Hindi phonemes
Michaud et al. Nasal release, nasal finals and tonal contrasts in Hanoi Vietnamese: an aerodynamic experiment
Bansal et al. Emotional Hindi speech: Feature extraction and classification
JPS6138479B2 (ja)
Maddieson Articulatory Phonology and Sukuma" Aspirated Nasals"
JPS58199399A (ja) 音節抽出方式
Gunnar Phonetic and phonemic basis for the transcription of Swedish word material
Huckvale Word recognition from tiered phonological models
Hasegawa-Johnson et al. On The Definition of the Word “Segmental”
Alotaibi et al. A new look at the automatic mapping between Arabic distinctive phonetic features and acoustic cues
Zain et al. A review of CALL-based ASR and its potential application for Malay cued Speech learning tool application
Raborife et al. Developing a corpus to verify the performance of a tone labelling algorithm
JP2760096B2 (ja) 音声認識方式
Bhagath et al. Acoustic phonetic approach for speech recognition: A review
JPH05173589A (ja) 音声認識応答装置
JPS6126099A (ja) 音声基本周波数抽出方法
JPS62299899A (ja) よう音・直音言い分け評価方式
JPS60164800A (ja) 音声認識装置