JPS58199399A

JPS58199399A - 音節抽出方式

Info

Publication number: JPS58199399A
Application number: JP57082632A
Authority: JP
Inventors: 純一市川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-05-17
Filing date: 1982-05-17
Publication date: 1983-11-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】、（ａ）発明の技術分野本発ψｊは旨声認識装奮に係シ、特に一つ一つの音節の
特徴が明瞭に出る稈度にゆっくりと発声された文章を音
節単位に分割して認識するため、音節の境界を示す母音
及び撥音の検出を行なう音節抽出方式に関する。

（ｌ））　　技術の背景Ｌ］本語の文章を計算機に入力して処理する手３段とし
てａ声を使用することは、それが自然な発声ンこよって
行々えるならば、１）人間にとって最も自然であり、従って負担が最も軽
い、２２　　人力連破もキーボード等の他の手段に比して速
い、等の特徴を持ち、理想的な方法といえる。しかしながら
自然に発声された連続音声を音声認識装置にルｔで認識
することは、各音韻の結着的特徴が前後の音しによって
影響を受ける調音結合の問題、各音■の特徴が必ずしも
明確に出ない吟の問題のため簡単には実現されそうもな
いのが現状である。

上記の如き連続音由の認識に於ける困難を避けるために
、日本語が単音節の連鎖として表わされることを利用し
て、音節単位に区シー１って発声する方法が考えられる
。こうすることにより音節の切り出し、調音結合の問題
が回避され、音節単位のパターン認識を行なえば良いこ
とになる。しかしこの方法は音節単位に息を止める会費
がおるため発声者に大きな負担がかかり、又入力速度も
遅くなると召う欠点があるだめ、その対策が望まれてい
る。

（ｃ）　　発明の目的本発明の目的は上記安値に基づき必ずしも五節単位に息
を止めず（で各音節の％黴が余シ調廿結合の影響を受け
ない程度にゆっく９発声した文章を先ず音節単位に分割
し、その音節を識別することにより文章の認識を行なう
ようにするための音節の区分を示す母音又は撥音の区間
を検出する音節抽出方式を提供するととＫある。

（ｄ）　　発明の構成本二３す３の構成は音節の特徴が出るようにゆっくり大
月きれた文章を音節単位に分割し、該音節を認識するこ
とにより文章の認識を行なう音声認識装置に於て、人力
背戸の各時刻に於ける瞬時電力と６−の特徴を衣わす量
を計算する手段と、該特徴蓋の時間笈化率を計算する手
段と、日本語の５母裕及び撥廿に対応する音韻の特徴績
を記憶する手段と、酌６己入力音声の特徴績と５母音及
び撥音の特徴績との類似度を計覧！する手段と、該類似
度ｉ／Ｊ’最大となる一ｋｆ韻とその類似度を求める手
段とを設け、前記瞬時電力が一定値以上で且つ前記特徴
績の時間変イｒ率が一定値以下となる区間に於て、前記
ポ人＠領度が一定値り、上となる音韻が同−音韻でＩｔ
つ−（時間喝）上絵、続した場合、該音韻を一つの予４
筋の母音又は撥音の区間であると判定するようにしたも
のである。

文章を音節即位に分割するには日本語の音節がｌＩｄ’
ず一つの母音又は撥音を含むことを利用して、人ツバｆ
　ｐの各時に１ｊに於ける瞬時”１と力が一定値以上で
ｈつ音韻の特徴績の時間変化率が一定値以下の区間に於
て、該人力音韻の特徴を表わす特徴パターンと日本語５
母音及び撥音に対応する音韻の標準パターンとの間の類
４ｉＪ度をヤ神゛１２、影入力ｔｔ口の特徴パターンの
計ｎ値が予め定めたー餉より大きく月つ同−音韻であっ
て予め電めた継続時間以上伏いた。場合、該音韻は一つ
の音節の母音か父は検音の区間であると判定し７、それ
を基に召６（）の切り出１７を竹なうものである。

（ｃｌ　　発明の実施例第１図は本発明の一実施例を示す回路のブロック図で第
２図は音ｙ巾間を決定する過程を廓明する図であるＣ）マイクロホン等より入力された一１１′Ｐ−は人力より
ｔ＋＋做轍及び電力計１憔１に入り、一定時間同一毎に
貼時電力と■旧ｉの特徴を表わす量（例えば短時間糸幅
スペクトルに対応する閂）が６１獅され、特Ｃγ鯵時間
変化率泪算ｆ、Ｑ　２に送られ、註ｔｆ韻の特徴を表わ
す量が時間的にどの桟度侵化しでいるかを衣わす待望−
１時間変化率が計算さｔするっ類似度８１゛＃Ｌ８ｐ３
に入った一Ｆ記１ｄ′＋−３はメモ９４に予め格納さ１
１ているア、イ　ウ、毛オとンの５母音と敬廿の特似貝
と知−１１，１度がｇＴ　ｊｌされる。即ち入力音声の
音韻Ｑ）荷微量と該５母昌及び恨音（Ｖ、後柳音は母音
に含む）の特ｇ菫との距離が道内ｇｆ算され類似度が最
大になる音韻と、その時の蔵人類似度が求めらノＬる。

第２図Ｕ　ｌ−ゴカッ」と発％ｌＩＬ、た時の瞬時電力
と、経じ韻の母ｉとの最大類似度と、該最大類似度がど
の母音に＆−ｊして得られたかと、該音韻の特徴蓋の時
間変イ１、率とを夫々時間＠もの方向に展開して示して
いる。９は音塵波形をサンプリングし、た時の瞬時電力
の大きざを示（７、サンプリングの間隔７．；］へ′、
Ｂ５ｍ５から３０ｍ５程度迄が用いられる。

＋１ｒＪ音ル検田レベルを定める閾値であシ、核間＃　
））上の電力が検出された区間が音声ン間である。１０
は母召区間を検出するレベルを定める障１値で、該レベ
ル以上の瞬時電力の鞄く区間からルミをθ゛ｒｉ：すイ
）。１２は前記サンプリング間隔で類似度言１算郡３に
より計算された各サンプリング、へらに於ける最大類似
度、即ち母音にｍ１人されている例えば／ｉ／、／ｕ／
ｌ　１０／吟の母−１からの類似度を示す包結線である
、１３は母音区間を検出するレベルを定める閾値をりＪ
モ’−７５，Ｅり閾ｆ１１１より大きい類似度の部分が
一定区間続くと、それが母音区間である。１５は前記サ
ンプリング間隔で特徴皺時間変化率側算部２により計算
された特徴値が時間的に変化している特徴値時間変化率
を示す包結線である。子音は時間的に変化する量が大き
く、母音は時間的に変化する址が小さいｏ１６は母音区
間を検出する閾値で、８？閾値より変化量の小さいｂ間
が母音８間である。

第１図に於て、類似度計算部３より送出烙れた信号は母
音区間決定部５に於て、音声の瞬時′Φ５カが母音区間
を検出する閾値より大きく、特徴Ｒ１’ｆ１定化率が母
音区間を検出する閾イ山より小さく、［［つ最大類似度
が母音区間を検出する閾値より大きい区間に於て、同一
音韻が一外′時間経続するかどうか判定され上記朱件が
満場れた区間を母音区間と決定する。音節区間沃定部６
は母音区ｒＨｊ決定部５の情報を基に一つの母音区間の
終シから次の母音区間の借り迄と、旨声［３−間の始め
から始めて；・ｋ出６スまた１琺７Ｊ、　ｌ〆１ｊｉＪ
のｈ１ζシ迄を一つの音節区間（。

決定して音節１識部７へ送る。音節認識部７はｔ゛節標
準パターン格納部８よりの旨節僚準パターンとパターン
マツチングを行なって音節単位の認識を行ない、該音節
のつながりとして日本一文章がａ３識される。

？１２し１にυ゛て、母音区間が・０乙／　ａ　／、　
、、ｕ、／と３ケＲ「検出され、８声区間の始めよシ母
音区間、−’　ｏ　／の疼ミシ迄と、母音区間１０／の
終りから母修区間／ａ／の４′ニジ迄と、音声１８間の
始めより母音区間／ｕ／の終シ迄の合計３ケの音節区間
が検出された事を肉−す。１４は最大類似度が閾値を越
え撥ｉｆ　／　ｎ　／とじて検出された事を示すが特徴
音Ｐ１間変化率では変化が大きく母音ではない事を示し
７ており、％微量時間変化率を用いることにより母音区
間検出の正確度が向上した事を示す。

（、ｆ）　　Ｑす」の効果ｊソ十明明した如く本発明は日本語が基本的に音節のつ
ながりから成り、その音節は撥音、単独はｉ、又は子音
十母音の組合せよシ成ることをオリ用しマー、−ｔ’Ｇ
ｔｉｌ」の９害′ｊを付：工っており、γＣｈ：Ｉ認識
を何なえば文章を認識することが可能である。従って音
節の特徴が出る＋′、度にゆつくシ発ルした文章を８４
機に音声入力して処理！はせ得るため、＠座者の共相を
増すこともなく、その効シ？は大なるものがある。

【図面の簡単な説明】

第１し１は本発明の一実施例を示す［す；路のブロック
Ｍ１第２図は音節区間を決定する。ＪＪ程を説明する図
である。１は特徴ｈ・及び′−力ｉＩｔ警部、２は特使飯時間変
化率計算部、３は類似度計算部、４はメモリ、５は母音
区間決定部、６は音節１メ間決定部　７は汁節認識部、
８は音節標準パターン格納部である。

Claims

【特許請求の範囲】

発声された文章を音節単位に分割し、該音節を闘識して
文章を認識する音声認識装置にがて、入力音声の各時刻
に於ける瞬時電力と音韻の特徴を表わす量を計算する手
段と核特微量の時間変化率を１算する手段と日本語の５
母音及び撥音に対応する音韻の特徴量を記憶する手段と
前記入力音声の特徴量と５母音及び撥音の特徴量との類
似度を計算する手段と一類似度が最大となる音韻とその
′類似度を求める手段とを設け、前記瞬時電力が一定値
以上で且つ前記特徴蓋の時間変化率が一定値以下となる
区間に於て、前記最大類似度が一定値以上となる音１が
同一音韻で且つ一定時間以上継続した場合、該音齢を一
つの音節の母音又は撥音の区間であると判定することを
特徴とする音節抽出方式。