JPS61113100A - 音声パラメ−タ検出装置 - Google Patents

音声パラメ−タ検出装置

Info

Publication number
JPS61113100A
JPS61113100A JP59235635A JP23563584A JPS61113100A JP S61113100 A JPS61113100 A JP S61113100A JP 59235635 A JP59235635 A JP 59235635A JP 23563584 A JP23563584 A JP 23563584A JP S61113100 A JPS61113100 A JP S61113100A
Authority
JP
Japan
Prior art keywords
data
voice
register
audio
cross number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59235635A
Other languages
English (en)
Other versions
JPH0562756B2 (ja
Inventor
真雄 坂間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Gakki Co Ltd
Original Assignee
Nippon Gakki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Gakki Co Ltd filed Critical Nippon Gakki Co Ltd
Priority to JP59235635A priority Critical patent/JPS61113100A/ja
Publication of JPS61113100A publication Critical patent/JPS61113100A/ja
Publication of JPH0562756B2 publication Critical patent/JPH0562756B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声認識の分野、において用いられる音声パ
ラメータ検出装置に関する。
〔従来技術〕
一般的な音声認識装置は、音声信号から音声の特徴パラ
メータを抽出し、この特徴パラメータと・辞書と呼ばれ
るメモリ内に記憶されている検車パラメータとを比較(
パターンマツチング)することによって音声舅識を行う
。この場合、音声の特徴パラメータとしては、パーコー
ル係数、線形予測係数、零クロス回数(音声信号が零レ
ベルを横切る回数)等が用いられるが、特に零クロス回
数を特徴パラメータとして用い、かつ、線形マツチング
あるい1jDP(ダイナミックプログラム)マツチング
を採用した音声認識装置は、価格が安価であるところか
ら簡易型の認識装置としてしばしば用いられている。そ
して、この発明は零クロス回数を特徴パラメータとして
用いた音声認識装置ηにおいて用いられる音声パラメー
タ検出装置に関する。
〔発明が解決しようとする問題点〕
ところで、この種の音声パラメータ検出装置においては
、音声の始端および終端、言い換えれば音声区間を正確
に検出することが必要である。従来、この音声区間(始
端、終端)の検出は、一定のしきい値を定め、音声信号
がこのしきい値を越えたか否かに基づいて行っていた。
例えば第6図の音声信号の場合、しきい値をレベルL1
とすると、区間Taを音声区間として検出していた。し
かしながら、このように始端、終端を共に一定のしきい
値に基づいて検出すると、次の様な問題が生じる。すな
わち、音声には例えば鼻音nn″のように終端付近の信
号レベルが小はいものがある。
このような音声の終端を正確に検出すべく、シきい値レ
ベルを小さくすると、始端検出時において雑音を音声始
端として検出してしまう。一方、この雑音の影響を除去
すべく、シきい値レベルを大とすると、上述した鼻音等
の場合に終端を正確に検出し得なくなる。
この発明は上記の事情に鑑み、音声始端検出時において
雑音の影響を受けることがなく、しかもイg号レベルの
小はい音声終端をも正確に検出することができる音声パ
ラメータ検出装置を提供することを目的とする。
〔問題を解決するための手段〕
この発明は、音声始端および音声終端を各々異なる値の
しきい値によって検出するようにしたものである。すな
わち、音声始端は雑音の影響を受けにくい、比較的高い
値のしきい値によって検出し、一方、音声終端は信号レ
ベルの小さい終端をも検出できるように、低い値のしき
い値によって検出する。
し実施例〕 第1図はこの発明の一実施例の構成を示すブロック図で
ある。この図において、符号1は音声を音声信号に変換
するマイクロフォン、2は音声イ%f号の高域成分を強
調するプリエンファシス回路であり、フィルタ回路が用
いられている。ADC(アナログ/ディジタル変換器)
3はプリエンファシス回路2を通過した音声信号を例え
ば周波数10KT(zでサンプリングしてディジタル音
声データ■に変換し、出力する。クロス数カウント回路
4は、パルス発生部と、カウンタ部とから構成ばれる。
パルス発生部は音声データVDが制御回路5から供給さ
れるしきい値S)(を横切る毎にパルス信号を出力する
回路である。すなわち、このパルス発生部は、今回AD
C3から出力された音声データVDと、前回ADC3か
ら出力ばれた音声データVDとを比較し、前回の音声デ
ータVDが今回の音声データVDに変化する際しきい直
S IIを横切っている場合にパルス信号を出力する。
カウンタ部はカウンタとラッチとから構成される。カウ
ンタは上記パルス発生部から出力されるパルス信号をア
ップカウントするもので、この実施例においては10m
5ecが経過する毎にリセットされる。ラッチは、上記
カウンタがリセットされる直前のカウント値をラッチし
、このラッチしたデータをクロス数データCDとして逐
次出力する。すなわち、クロス数データCDは一定時間
(10mSeC)内に音声信号がしきい値8■Iを横切
った回数を示すものである。なお、上述したクロス数デ
ータCDは、電源投入以後常時出力される。また、以下
の説明においては、クロス数カウントの単位(10m5
ec)をフレームと称する。制御回路5に、クロス数デ
ータCDに基づいて音声の始端および終端を検出し、検
出した始端および終端間の各クロス数データCDをその
間のスレーム数と共に音声パラメータPRとして音声認
識回路6へ出力し、また、しきい値SHをクロス数カウ
ント回路4へ出力する。
音声認識回路6は音声パラメータPRに基づいて音声認
識を行う。
次に、制御回路5の詳細を第2図〜第5図を参照して説
明する。この制御回路5け、プログラムコントロールに
よるC P U (中央処理装置)と、記憶回路とを具
備しており、記憶回路は、CPUにおいて用いられるプ
ログラムが記1意されCいるROMと、データ記憶用の
RAMとから構成ばれている。そして、IIAM内には
、第2図に示す各内部レジスタが設定されている。これ
らの内部レジスタの名称は次の通りである。
IR:イノプアトレジスタ FC:フレームカウンタ EFIt :エンドフレームレジスタ CFR:中間フレームレジスタ CDIL :クロス数データレジスタ 次に、上記CP Uの動作を第3図に示す流れ図を参照
して説明する。電源が投入これると、まず、ステップS
1の処理へ進み、各内部レジスタ〔第2図)を各々クリ
アする。次に、ステップS2へ進むと、しきい値SHと
1−でデータαを出力する。
このデータαは、音声信号の始端を検出するためのしき
い値であり、雑音の影響を受けないように、比較的高い
値となっている。そして、このデータαはクロス数カウ
ント回路4内にラッチ京れる。
次にステップS3へ進むと、まずフレーム時間と同じ時
間10m5ecを計測した後、クロス数カウント回路4
から出力されているクロス数データ■をインプットレジ
スタI R内に畜込む。次にステップS4へ進むと、イ
ンプットレジスタIRの内容が「0」か否かを判断する
。ここで、マイクロフォン1に1だ「声が入力されてい
ないとすると、クロス数データCDは「0」であり、し
たがって、ステップS4の判断結果はrYESJと、な
り、ステップS1へ戻る。以下、マイクロフォン1に音
声が入カブれるまで、上記のステップ81〜S4を繰返
す。
次に、マイクロフォン1に音声が入力されると、クロス
数データCDが「0」以外の値となり、したがってステ
ップS4における判断結果がrNOJとなり、ステップ
S5へ進む。ステップS5では、しきい値S Hとして
データβを出力する。このデータβは、クロス数カウン
ト回路4内にラッチされる。このデータβの値は、信号
レベルが小さい音声信号終端をも検出できるように、前
述したデータαより小ζい値となっている。なお、第4
図にデータαとデータβの各位の一例を示す。図に示す
波形は音声信号の一例であり、また、図に示す区間Tα
はクロス数カウント回路4においてデータαがしきい値
SHとして用いられる区間、区間Tβはデータβがしき
い値S Hとして用いられる区間である。次に、ステッ
プS6へ進むと、7レームカウンタFCの内容(むの場
合「0」)をインクリメントする。これにより、同フレ
ームカウンタFCの内容が「1」となる。次に、ステッ
プS7へ進むと、インプットレジスタIRの内容を7レ
ームカウンタFCが指示するクロス数デーpvジxpc
DRmへ転送する。なお、このレジスタCD Rf!l
へ転送されたデータは、ステップS3においてインプッ
トレジスタIRへ入力されたクロス数データCDであり
、音声信号の立上りに対応する最初のクロス数データC
Dである。次にステップS8へ市百むと、1Q m5e
cの時間計測をした後、クロス数カウント回路4から出
力されているクロス数データCDをインプットレジスタ
I Rへ入力する。次にステップS9では、インプット
レジスタI Rの内容が「0」か否かを判断する。音声
信号が連続してマイクロフォン1力1ら出力されている
時はこの判断結果が「NO」となり、ステップS6へ戻
る。以後、ステップS9の判断結果がrY E S J
となるまでステップ86〜S9の過程を繰返す。これに
より、クロス数データレンスタCD Hull、 CD
R(21・・・に順次クロス数データCDが書込まれ、
また、フレームカウンタPCの内容が「1」づつ順次大
きくなる。
次に、音声信号が途切れると、ステップS9の判断結果
がrYEsJとなり、ステップSIOへ進む。ステップ
S10では、フレームカウンタF(’l”の内容(いま
、この内容なr M Jとする)がエンドフレームレジ
スタEFRへ転送される。次いでステップ811へ進む
と、フレームカウンタF(”の内容r M Jが一定値
Dl(例えば「10」)より小か否かが判断される。
そして、この判断結果がrYEsJの場合はステラ78
1に戻る。このステップ811は雑音を検出するための
ステップである。すなわち、マイクロフォン1には、し
きい値SHrα」よりレベルの大きい雑音が入力される
場合がある。そこでこの実施例においては、「0」でな
いクロス数データCDが一定時間(T)IXI 0m5
ec)以上連続しなかった場合は、マイクロフォン1に
入力はれた音を雑音とみなし、パラメータ検出処理を行
わないようになっている。ステップ811におけるフレ
ームカウンタFCの内容「MJは、「0」でないクロス
数データCT)が】専続して出力されたフレーム数を示
し、また1フレームの時間は10m5ecであり、した
がって、M〈工)1の場合は、「0」でないクロス数デ
ータCT)が一定時間(D lX10訃ec)連続しな
かった場合、すなわち雑音の場合に相当する。
次に\ステップS11の判断結束がrNOJの場合は、
ステップ812へ進み、フレームカウンタFCをインク
リメントする。次いでステップ813へ進むと、インプ
ットレジスタIRの内容を、フレームカウンタFCが示
すクロス数レジスタCDR(M+1)へ転送する。なお
、この時点におけるインプットレジスタIRの内容は、
最後に実行ばれたステップS8においてレジスタIRに
書込まれたクロス数データCI)であり、したがって、
その値は「0」である(ステップS9の判断結果がrY
EsJ )。次に、ステップS14へ進むと、フレーム
カウンタFCの内容からエンドフレームレジスタEFR
の内容rMJを減算し、次いでこの減算結果が一定値D
2(例えば「2o」〜r30J)より大か否かを判断す
る。そして、この判断結果がrNOJの場合は、ステッ
プ815へ進む。ステップ815では、10m5ecの
時間計測を行った後、クロス数データCDをインプット
レジスタIRへ入力する。次いで、ステップ816へ進
むと、インプットレジスタI Rの内容が12」より小
か否がを判断する。そして、この判断結果が「YES」
の場合は再びステップ812へ戻る。
以下、ステップ812〜816が繰返えばれる。
そして、ステップ814における判断結果がrYEsJ
に々ると、ステップ817へ進み、エンドフレームレジ
スタEFRの内存、および、クロス数データレジスタC
DRfl+からエンドフレームレジスタEFRによって
指示されるクロス数データレジスタCDII(X]まで
の各レジスタCDHの内容を各々、音声パラメータPR
として音声認識回路6へ出力し、全処理を終了する。ま
た、ステップ816の判断結果が「NO」となった場合
は、ステップ818以下の各処理を行う。
次に、上述したステップ812〜S1dの処理の意味を
説明する。いま、例えば「前進(ぜんしん)」という音
声をマイクロフォン1に入力したとする。この場合、ク
ロス数データCDは時間の経過と共に第5Mに示すよう
に変化する。ここで、曲線E1は「前」の音声に対応し
、また曲線E2は「進」の音声に対応する。この図に示
すように、1つの言葉が発音された場合においても、音
声の途中で区切れが発生する。この区切れは全く発生し
ない場合もあり、また複数回発生する場合もある。そし
て、この区切れにおいては、クロス数データCDが「0
」となる。したがって、第5図に示す時刻t、において
クロス数データCDが「qとなり(この時、ステップS
9の判断がrYEsJとなる)、ステップS11の判断
がrNOJであっても(雑音ではない)、この時刻t、
において音声が終了したか否かの判断はできない。そこ
で、この実施例においては、クロス数データ(”Dが一
旦「0」となった時点以後、(D 2 X 10 m5
ec’)の時間連続してクロス数データCDが「2」以
下であった場合に音声の終了と判断するようになってい
る。すなわち、クロス数データCDが一旦「0」になっ
た時点以後、ステップS16の判断がrYEsJである
間はステップ812〜S16が繰返し実行される。この
際フレームカウンタFCの内容は順次インクリメントさ
れ(ステップ512)、したがって、ステップ814に
おける(FC−EFR)の値はクロス数データCDが「
2」以下を続けているフレーム数を示す。そして、この
フレーム数がD2より大になると、すなわち、(D2×
10 m5ec )の時間が経過すると、ステップS1
4における判断がrYESJとなり、音声終了と判断さ
れ、ステップS17の処理へ進む。一方、クロス数デー
タCI)が一旦「0」となった時点以降、上述した(D
2X10msec)の時間が経過する前にクロス数デー
タCDが「2」以上になった場合(第5図における時刻
t、参照)ハ、ステップ818の処理へ進む。
ステップ818では、この時のフレームカウンタFCの
内容(「N」とする)を中間フレームレジスクCFRV
C転送[7、次いでステップSI9へ進ムト、フレーム
カウンタF’Cの内容をインクリメントとする。次に、
ステップS20へ進むと、インプットレジスタI Rの
内容(ステップS15において人力これたクロス数デー
タCD)をフレームカウンタFCが示すクロス数データ
レジスタCDR(N+1)へ転送する。次に、ステップ
S21では、10m5eCの時間を計測した後、クロス
数データCT)をインプットレジスタIRへ入カスる。
次いでステップS22では、インプットレジスタIRの
内容が「0」か否かを判断する。そして、この判断結果
が「NO」の場合は、再びステップ819へ戻り、以後
、ステップ822の判断結果がrYEsJとなるまでス
テップ819〜822の過程を緑返す。この繰返しによ
り、第5図の音声の場合は、「進」に対応する各クロス
数データCDがクロス数データレジスタCDR(N+1
 )、  (N+2 )・・・にj−次曹込まれる。次
に、ステップ822における判断結果がrYESJにな
ると、ステップ823へ進む。ステップS23では、そ
の時点におけるフレームカウンタFCの内容から中間フ
レームレジスタCFRの内SrNを減算する。この減算
結果は、第5図の例の場合、時刻t、〜t4間のフレー
ム数を示している。次に同減算結果が前述した一定数D
1より小か否かを判断する。そしてその判断結果がrY
 E S Jの場合(第5図の例の場合は「NO」とな
る)、すなワチ、ステップ819〜S22の繰返し蹟よ
ってクロス数データレジスタCT)Rに収録したデータ
が雑音のデータであった場合は、ステップ817へ進む
。この処理は、ステップ819〜S22の繰返しによっ
てレジスタCDHに収録したデータを無視し、ステップ
SIOの時点で音声が終了していると判断することを意
味する。一方、ステップ823の判断結果がrNOJの
場合は、ステップ824へ進み、その時のフレームカウ
ンタPCの内容ヲエンドフレームレジスタE I” R
へ転送スる。そして、ステップS12へ戻る。以後、再
びステップ812〜S16の過程を繰返す。そして、ス
テップS14の判断がrY E S Jとなればステッ
プS17へ進み、パラメータ出力を行い、また、ステッ
プ814の判断がrYEsJになる前に、ステップ81
6の判断がrNOJになれば、再びステップ818以降
の処理を行う。
以上が第1図〜第3図に示す実施例の詳細である。なお
、第3図の流れ図においては記載を省略しているが、こ
の実施例においては、音声が1.6sec以上継続した
場合、すなわち、フレームカウンタECの内容がl”’
160Jを越えた場合は、パラメータ検出を中止し、ス
テップS1へ戻るiうになっている。このため、クロス
数データレジスタCI)Rの数も160となっている。
このようにしている理由は、音声認識回路6において認
識し得る音声の最大継続時間が1.6SeCであるから
である。
また、上記実施例においては、ADC3から出力される
ディジグル音声データVDK基づいてクロス数データC
Dを得ているが、これに代えて、プリエンファシス回路
2から出力されるアナログ音声信号をレベル比較するこ
とによりクロス数データCDを得るようにしてもよい。
また、上記実施例においては、音声データVT)がしき
い値S Hを下から上に横切った場合、あるいは上から
下に横切った場合のいずれの場合においてもクロス数を
カウントしているが、いずれか一方の場合のみカウント
するようにしてもよい。
〔発明の効果〕
以上説明したように、この発明によれば音声始端および
音声終端を各々異なる値のしきい値によって検出するよ
うにしたので、音声始端の検出時においては雑音の影響
を受けることがなく、シかも音声終端の検出時において
は信号レベルの小さい音声終端をも正確釦検出すること
ができる効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例の出成を示すブロック図、
第2図は同笑施例における制御回路5内に設けられてい
る内部レジスタを示す図、第3図は同制御回路5内に設
けられているC P Uの動作を説明するための流れ図
、第4図はしきい値αおよびβの大きざの一例を音声信
号との関連の上で示す図、第5図はクロス数データCD
の変化状態の一例を示す図、第6図は従来の音声認識装
置におけるしきい値L1を音声信号との関連の上で示す
図である。 1・・・・・・マイクロフォン、4・・・・・・クロス
数カウント回路、5・・・・・・制御回路。 第3図

Claims (1)

    【特許請求の範囲】
  1. 入力される音声信号が所定時間内にしきい値を交差する
    数を時間の経過と共に逐次計数し、この計数結果をクロ
    ス数データとして順次出力するクロス数カウント手段と
    、前記クロス数データに基づいて音声信号の始端および
    終端を検出する検出手段と、音声信号の始端検出前にお
    いて前記しきい値を第1の値に設定し、前記検出手段が
    音声信号の始端を検出した時点以後前記しきい値を前記
    第1の値より零レベルに近い第2の値に変更制御する制
    御手段とを具備してなり、前記検出手段によつて検出さ
    れた音声信号の始端および終端に基づいて音声パラメー
    タを検出することを特徴とする音声パラメータ検出装置
JP59235635A 1984-11-08 1984-11-08 音声パラメ−タ検出装置 Granted JPS61113100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59235635A JPS61113100A (ja) 1984-11-08 1984-11-08 音声パラメ−タ検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59235635A JPS61113100A (ja) 1984-11-08 1984-11-08 音声パラメ−タ検出装置

Publications (2)

Publication Number Publication Date
JPS61113100A true JPS61113100A (ja) 1986-05-30
JPH0562756B2 JPH0562756B2 (ja) 1993-09-09

Family

ID=16988938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59235635A Granted JPS61113100A (ja) 1984-11-08 1984-11-08 音声パラメ−タ検出装置

Country Status (1)

Country Link
JP (1) JPS61113100A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置
JPH0392900A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 音声認識制御装置
JPH0677894A (ja) * 1986-06-02 1994-03-18 British Telecommun Plc <Bt> 無線端末装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0677894A (ja) * 1986-06-02 1994-03-18 British Telecommun Plc <Bt> 無線端末装置
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置
JPH0392900A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 音声認識制御装置

Also Published As

Publication number Publication date
JPH0562756B2 (ja) 1993-09-09

Similar Documents

Publication Publication Date Title
US4541110A (en) Circuit for automatic selection between speech and music sound signals
JPS61113100A (ja) 音声パラメ−タ検出装置
JPS61156100A (ja) 音声認識装置
JPH05100661A (ja) 小節境界時刻抽出装置
CN115148208B (zh) 音频数据处理方法、装置、芯片及电子设备
JPS62237498A (ja) 音声区間検出方法
JP2962066B2 (ja) 音声分析装置
JPS59124397A (ja) 無音区間検出回路
JPH07219580A (ja) 音声領域検出装置
JPS6120880B2 (ja)
JPS60498A (ja) 音声検出装置
JPS59158124A (ja) 音声デ−タ量子化方式
JPS61140999A (ja) 音声区間検出方式
JPS6239754B2 (ja)
JPS60167000A (ja) ピツチ抽出器
JPS6267598A (ja) 音声区間検出方式
JPH0679236B2 (ja) 音声スペクトルの2値化装置
JPS6223096A (ja) 音声区間検出装置
JPS59102296A (ja) ピツチ抽出方法
JPS59231600A (ja) 音声区間検出方法
JPS60201400A (ja) 音声スペクトルの2値化装置
JPS5928200A (ja) 零交差検出回路
JPH04240899A (ja) 音声認識装置
JPS58192095A (ja) 音声認識装置
JPH0394300A (ja) 音声検出器