JPS61177000A - 音声パタ−ン登録方式 - Google Patents

音声パタ−ン登録方式

Info

Publication number
JPS61177000A
JPS61177000A JP60017656A JP1765685A JPS61177000A JP S61177000 A JPS61177000 A JP S61177000A JP 60017656 A JP60017656 A JP 60017656A JP 1765685 A JP1765685 A JP 1765685A JP S61177000 A JPS61177000 A JP S61177000A
Authority
JP
Japan
Prior art keywords
vowel
consonant
registering
unit
pattern registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60017656A
Other languages
English (en)
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60017656A priority Critical patent/JPS61177000A/ja
Publication of JPS61177000A publication Critical patent/JPS61177000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 及五公立 本発明は、音声認識装置の標準パターン登録方式に関す
る。
l惠伎血 一般に、単語音声認識方式は認識すべき単語の標準パタ
ーンを保持し、未知の久方が登録されているどの標準パ
ターンと類似しているがを求め、最大類似を得た標準パ
ターンの単語名を認識結果とするものが多い。この場合
、登録単語数が増えると登録が面倒になるという欠点が
ある。このため、あらかじめ音声の基本単位となるパタ
ーンを保持しておき、登録すべき単語が決まると、この
音声基本単位の組合わせによって単語パターンを合成す
ることが考えられている。この音声の基本単位として単
語節を選ぶと、68〜120のパターンを用意するだけ
であらゆる単語が構成できるという長所がある反面、人
間の発声した音声は音から音への変化いわゆる調音結合
によって変形されるため、合成された音との差が大きく
なるという欠点がある。そこで、これらを考慮した上で
、母音−子音−母音(VCV)の組合わせを一単位とす
ることが最良と考えられる。この方式ではあらかじめ用
意するパターンは700程度になるが調音結合も考慮さ
れている。VCV単独の発声が難しいことや一つの単語
内に複数のVCVが含まれていることを考え合わせ、決
められた数100の単語を発声することによって全vC
■をその中から切り出し、それを用いてあらゆる単語パ
ターンを構成することができるようになる。ところが単
語中から、CVやVCVを切り出す場合、特に後半のC
vが/ K u /等では/u/が無声化して不良のV
C■CV−ンを登録してしまうことになる。
一巨追 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、子音−母音、或いは母音−子音−母音単位の標準
パターンの作成において、質の良いパターンを登録する
ことを目的としてなされたものである。
1威 本発明は、上記目的を達成するため、発声された単語音
声中から子音−母音(CV)又は母音−子音−母音(V
 CV)単位のパターンを抜き出して登録する音韻登録
方式において、 (1)、各VCV単位単位音声無声音の判定を行い、末
尾近傍が有声のもののみを標準パターンとして登録する
ようにしたこと、或いは、(2)、各CVCa位内の音
声パワーの時間情報をつけ、末尾近傍のパワーが一定値
以上のもののみを標準パターンとして登録するようにし
たこと、或いは、 (3)、各VCV単位単位音形の零交差数の時間情報を
つけ、末尾近傍の交差数がある範囲内であった場合のみ
標準パターンとして登録するようにしたこと、或いは、 (4)、各VCV単位単位音声パワーの時間変化分の情
報をつけ、末尾近傍の変化分が少ないもののみを標準パ
ターンとして登録するようにしたこと、或いは、 (5)、各CVC単位内を周波数分析し、時間的に近接
する周波数成分が類似しているもののみを登録するよう
にしたことを特徴としたものである。
以下、本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための電気的構
成図で、図中、1は音声入力部、2は特徴量変換部、3
はCV又はVCV切り出し部、4は有/無声音判定部、
5は末尾近傍が有声か否かを判定する判定部、6はパタ
ーン登録部である。
而して、この実施例は、母音が有声音であることを利用
したもので、まず、VCV切り出しのための音声が入力
され、それが特徴量に変換される。
特徴量としては周波数分析でも線形予測係数でも何でも
良い。これを利用する音韻単位に応じてCV又はVCV
に区切り、切り出す。この切り出し方はパターンが大き
く変化した場所やパワーの変動状況を利用することによ
って行えるが、言うまでもな(、パターンを表示して人
間が視察によって切り出しても良い。先に、変換された
特徴量は10m秒程度毎に時間平均をとることでデータ
量を減らされることが一般で、各々の10m秒(フレー
ムと呼ぶ)内の音声が有声音であるか無声音であるかの
判定を行い、これを切り出された音韻の各フレームにつ
ける。次に、この音韻後部のラベルが有声音であればこ
れを標準パターンとして登録し、そうでなければ、次の
音韻の判定に移る。
更には、次の単語の入力を待つことになる。ここで、有
/無声音の判定法として知られているものとして、周波
数成分が低域に集中するものと高域に集中するものとで
分別することができる。
第2図は、本発明の他の実施例を説明するための電気的
構成図で、図中、11はパワー検出部、12は末尾近傍
のパワーが大か否かを判定する判定部で、この実施例は
、母音ではパワーが他に比べて大きいことを利用したも
のである。なお、企図を通して同様の作用をする部分に
は同一の参照番号が付しである。
第3図は、本発明の他の実施例を説明するための電気的
構成図で、図中、21は零交差数計算部、22は末尾の
交差数がある範囲の値αより小さいか否かを判定する判
定部で、この実施例は、特徴、量変換の前に波形の零交
差数を計算し、この情報によって音韻パターンの末尾が
母音か否かを判定するものである。この場合、母音は他
の子音に比べ零交差数が少なくなるが低域のノイズ等を
考慮しである範囲αを決めれば良い。なお、このαは1
フレームの時間長も考えに入れて決めねばならない。
第4図は、本発明の他の実施例を説明するだめの電気的
構成図で、図中、31はパワー差分検出部、32はパワ
ー差分がある範囲の値βよりも小さいか否かを判定する
判定部で、この実施例は、CV又はvC■に切り出し後
、各フレームのパワーを求め隣接するフレーム間のパワ
ーの差を求めておき、CV又はvC■の末尾近辺のパワ
ーの差が小さい場合にはこのパターンを登録し、大きい
場合には登録しないようにしたものである。これは子音
はパワー変動が激しく、母音では定常的であることを利
用したものである。
第5図は、本発明の他の実施例を説明すための電気的構
成図で、図中、41は周波数分析部、42は隣接フレー
ム間の差を検出する検出部、43は上記隣接フレーム間
の差がある範囲の値γより小さいか否かを判定する判定
部で、この実施例は、母音では子音に比ベスペクトル成
分の変化が少ないことを利用したもので、特徴量として
周波数成分を用いて入力音声をいくつかの周波数帯域に
分けて周波数分析し、隣接するフレーム間或いは隣接に
準するフレーム間の各帯域毎の成分の差を求めておき、
正常なデータであると考えて登録するものである。なお
、第4図のβ、第5図のγの値は実際に子音や母音を入
力した時の値で決めておけば良い。
勉来 以上の説明から明らかなように、本発明によると、母音
の無声化が検出されるため質の悪いパターンを登録する
ことがなく、従って、標準パターンの質が向上する。
【図面の簡単な説明】
第1図乃至第5図は、それぞれ本発明の詳細な説明する
ための電気的構成図である。 1・・・音声入力部、2・・・特徴量変換部、3・・・
CV又はVCV切り出し部、4・・・有/無声音判定部
。 5・・・有声音判定部、6・・・パターン登録部、11
・・・パワー検出部、12・・・パワー判定部、21・
・・零交差数計算部、22・・・零交差数判定部、31
・・・パワー差分判定部、41・・・周波数分析部、4
2・・・隣接フレーム間の差検出部、43・・・フレー
ム差判定部。 第1図

Claims (5)

    【特許請求の範囲】
  1. (1)、発声された単語音声中から子音−母音又は母音
    −子音−母音単位を抜き出して登録する方式において、
    各単位に有/無声音の判定を行い、末尾近傍が有声のも
    ののみを標準パターンとして登録することを特徴とする
    音声パターン登録方式。
  2. (2)、発声された単語音声中から子音−母音又は母音
    −子音−母音単位を抜き出して登録する方式において、
    各単位内の音声パワーの時間情報をつけ、末尾近傍のパ
    ワーが一定値以上のもののみを標準パターンとして登録
    することを特徴とする音声パターン登録方式。
  3. (3)、発声された単語音声中から子音−母音又は母音
    −子音−母音単位を抜き出して登録する方式において、
    各単位毎に波形の零交差数の時間情報をつけ、末尾近傍
    の交差数がある範囲内のパターンのみを標準パターンと
    して登録することを特徴とする音声パターン登録方式。
  4. (4)、発声された単語音声中から子音−母音又は母音
    −子音−母音単位を抜き出して登録する方式において、
    各単位毎に音声パワーの時間的変化分の情報をつけ、末
    尾近傍の変化分が少ないもののみを標準パターンとして
    登録することを特徴とする音声パターン登録方式。
  5. (5)、発声された単語音声中から子音−母音又は母音
    −子音−母音単位を抜き出して登録する方式において、
    各単位毎に周波数に分析し、時間的に近接する周波数成
    分が類似しているもののみを登録することを特徴とする
    音声パターン登録方式。
JP60017656A 1985-01-31 1985-01-31 音声パタ−ン登録方式 Pending JPS61177000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60017656A JPS61177000A (ja) 1985-01-31 1985-01-31 音声パタ−ン登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60017656A JPS61177000A (ja) 1985-01-31 1985-01-31 音声パタ−ン登録方式

Publications (1)

Publication Number Publication Date
JPS61177000A true JPS61177000A (ja) 1986-08-08

Family

ID=11949894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60017656A Pending JPS61177000A (ja) 1985-01-31 1985-01-31 音声パタ−ン登録方式

Country Status (1)

Country Link
JP (1) JPS61177000A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171111A (ja) * 2004-12-13 2006-06-29 Mitsubishi Electric Corp 音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171111A (ja) * 2004-12-13 2006-06-29 Mitsubishi Electric Corp 音声認識装置
JP4699016B2 (ja) * 2004-12-13 2011-06-08 三菱電機株式会社 音声認識装置

Similar Documents

Publication Publication Date Title
Wu et al. Gender recognition from speech. Part I: Coarse analysis
JP2504171B2 (ja) 声門波形に基づく話者識別装置
CA2483607C (en) Syllabic nuclei extracting apparatus and program product thereof
KR100738332B1 (ko) 성대신호 인식 장치 및 그 방법
US9514738B2 (en) Method and device for recognizing speech
Aull et al. Lexical stress determination and its application to large vocabulary speech recognition
Prica et al. Recognition of vowels in continuous speech by using formants
Sarma et al. Consonant-vowel unit recognition using dominant aperiodic and transition region detection
JPH0558553B2 (ja)
Villing et al. Performance limits for envelope based automatic syllable segmentation
Ando Autocorrelation-based features for speech representation
JPS61177000A (ja) 音声パタ−ン登録方式
Juneja et al. An event-based acoustic-phonetic approach for speech segmentation and E-set recognition
Seman et al. Hybrid methods of Brandt’s generalised likelihood ratio and short-term energy for Malay word speech segmentation
JP4890792B2 (ja) 音声認識方法
Bhattachajee et al. An experimental analysis of speech features for tone speech recognition
Reddy et al. Neutral to joyous happy emotion conversion
JP2658426B2 (ja) 音声認識方法
JPH026078B2 (ja)
Resch et al. Time synchronization of speech.
Tamburini et al. Automatic annotation of speech corpora for prosodic prominence
Cosi Evidence against frame-based analysis techniques
JPS61249099A (ja) 音声認識装置
JPH03120434A (ja) 音声認識装置
JPH02226300A (ja) 音韻区間情報形成装置