JPS63127294A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPS63127294A
JPS63127294A JP61274287A JP27428786A JPS63127294A JP S63127294 A JPS63127294 A JP S63127294A JP 61274287 A JP61274287 A JP 61274287A JP 27428786 A JP27428786 A JP 27428786A JP S63127294 A JPS63127294 A JP S63127294A
Authority
JP
Japan
Prior art keywords
energy
voice
circuit
agc
electrical signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61274287A
Other languages
English (en)
Inventor
潤一郎 藤本
金内 邦容
安田 晴剛
河本 俊毅
中谷 奉文
章次 栗木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61274287A priority Critical patent/JPS63127294A/ja
Publication of JPS63127294A publication Critical patent/JPS63127294A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、音声区間検出方式、より詳細には、音声認識
装置における音声信号の検出に関するものである。
従来技術 音声認識装置を実現する上で音声区間をいかに忠実に切
り出すかは非常に重要であり、この音声区間の切り出し
が装置の能力を左右する。音声区間の切り出し方はいく
つか考えられるが、その代表的なものは第7図に示すよ
うなもので、図示のように、閾値T1を決めておき、入
力された信号のエルネギ−が該閾値T1を越えた時点t
、から該閾値T1を下る時点t、までを音声区間とする
ものである。ただし、この区間内に第2の閾値T2(T
、>T、)を越える部分がある時に限り、上記区間を音
声区間とするものである。この様な場合、冒頭の子音等
のエネルギーが小さい部分が欠落してしまうという欠点
があり、この対策としてエネルギーが小さい部分はその
エネルギーに応じて増幅して取り込む自動利得整(AG
C)回路をつける方法が考えられている。
第8図は、上記自動利得調整回路の一例を示す図で、図
中、20は音声とり込み部、21はAGC回路、22は
音声区間検出回路で、これによってかなり正確に音声の
区間が検出できるようになった。しかし、環境ノイズが
大きい場合、AGC回路によって環境ノイズを増幅して
しまい、常にノイズがT、を越してしまうということに
なる。
これに対し、環境ノイズによって閾値T工、T2を上下
する方法もあるが、AGCは大きい音を抑圧する作用が
あり、ノイズが大きいと、それに音声が加わってもノイ
ズの大きさから大きな出力エネルギーの変動がないため
、正確に切り出すことができなくなってしまう欠点があ
る。
1−一■ 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、環境雑音が存在する中で正しい音声の区間を検出
するための音声区間検出方式を提供することを目的とし
てなされたものである。
盗−一威 本発明は、上記目的を達成するために、音声を集音して
電気信号に変換し、変換された信号中から音声に係る部
分だけを抽出する音声検出方式において、(1)前記電
気信号を自動利得調vi(AGC)回路を通した後エネ
ルギーを求める部分と、前記AGC回路を通過せずにエ
ネルギーを求める部分を設け、音声を入力する前の状態
で前記AGC回路゛を通過したエネルギーが大なる時は
前記AGC回路を通過しないエネルギーが閾値を越える
部分を音声区間とし、小なる時は前記AGC回路を通過
したエネルギーが閾値を越える部分を音声区間とするよ
うにしたこと、或いは、(2)前記電気信号を自動利得
調整(AGC)回路を通した後周波数分析してその時間
的な変化を求めると共に該電気信号のエネルギーを求め
、エネルギーの小さな部分では前記周波数分析結果の時
間変化が大なる部分を音声の始点とし、前記AGC回路
通過後のエネルギーの大きな部分では前記AGC回路を
通過させない信号エネルギーが閾値を越えた部分を始点
とするようにしたこと、或いは、(3)前記電気信号を
自動利得調整(AGC)回路を通した後周波数分析して
その時間的な変化を求めると共に該電気信号のエネルギ
ーを求め、音声の始端は周波数分析結果の時間変化によ
って決定し、終端はエネルギーの大きさで決めるように
したことを特徴としたものである。以下、本発明の実施
例に基づいて説明する。
第1図は、本発明による音声区間検出方式の一実施例を
説明するためのブロック線図、第2図は、第1図の動作
説明をするためのフローチャートで、図中、1はマイク
ロフォン等の音響電気変換器、2は自動利得調整(AG
C)回路、3.4はフィルタ、5,6は検波回路、7〜
9は比較回路、10は選択回路、11は音声認識処理装
置で、この実施例は、音声を集音して電気信号に変換し
、変換された信号中から音声に係る部分だけを抽出する
音声検出方式において、電気信号を自動利得調整(AG
C)回路を通した後エネルギーを求める部分Iと、AG
C回路を通過せずにエネルギーを求める部分■を設け、
音声を入力する前の状態でAGC回路を通過したエネル
ギーが大なる時は前記AGC回路を通過しないエネルギ
ーが閾値を越える部分を音声区間とし、小なる時は前記
AGC回路を通過したエネルギーが閾値を越える部分を
音声区間とするようにしたものである。図において、マ
イク等の電気音響変換器1によって電気信号に変換され
た音声は2分され、一方(1)はAGC回路2を通した
後、音声帯域のフィルタ3を通し、検波器5にて検波し
てエネルギーを求め、他方(n)はAGC回路2を通さ
ずに前記と同様にしてエネルギーを求め、どちらも定め
られた閾値ε1.ε2を越えた部分を音声信号として選
択部10へ出す。又、音声入力前にAGC回路を通過し
た後のエネルギーをエネルギー閾値E1と比較してこれ
よりも大なる時1選択部10は前記AGC回路を通過さ
せない方の音声区間を正しいものとして音声認識処理部
11へ送り、小なる時はAGC回路2を通過した信号に
よって決めた音声区間を正しい区間として音声認識処理
部へ送るようにする。なお、ここで言うエネルギーの大
なる部分の音声区間の決定の仕方は第7図に示したよう
な方法で良く、あらかじめ何回か音声を入力しながら閾
値を決めれば良い。また、音声始端の子音はエネルギー
が小さいため回路AGCを通さずにエネルギーをチェッ
クしていると欠落させてしまう恐れがある。
第3図は、本発明の他の実施例を説明するためのブロッ
ク線図、第4図は、第3図の動作説明をするためのフロ
ーチャートで、図中、12は周波数変換部、13はフィ
ルタ及び検波回路、14は差分検出回路、15はエネル
ギー検出部で、その他第1図に示した実施例と同様の作
用をする部分には、第1図の場合と同一の参照番号が付
しである。而して、この実施例は、子音部はスペクトル
の変化が激しく音響エネルギーが小さいのに対し、母音
部はスペクトルの変化は少ないがエネルギーが大きいこ
とに注目してなされたものであり、特に、音声を集音し
て電気信号に変換し、変換された信号中から音声に係る
部分だけを抽出する音声検出方式において、前記電気信
号を自動利得調整(AGC)回路を通した後周波数分析
してその時間的な変化を求めると共に該電気信号のエネ
ルギーを求め、エネルギーの小さな部分では前記周波数
分析結果の時間変化が大なる部分を音声の始点とし、前
記AGC回路通過後のエネルギーの大きな部分では前記
AGC回路を通過させない信号エネルギーが閾値を越え
た部分を始点とするようにしたものである。すなわち、
音声はマイクロフォン1によって集音されて電気信号に
変換された後、部分され、一方(1)はAGC回路2へ
入り、他方(IT)は音声帯域のバンドパスフィルタ及
び検波回路13を通して信号のエネルギーの時間変化を
求める。求められた値が閾値ε、より大きいかどうかに
よって音声区間であるかどうかを決め、ε、より大なる
時は音声始端を選択部10へ向って発する。一方、AG
C回路2を通過した信号(1)はフィルターバンク等か
ら成る周波数変換部12で周波数分析し、その時間的な
変化の差分を差分検出回路14でとって変化量を求める
。この変化量が閾値ε2より大なる時はこれを音声の始
端とする信号を選択部10へ発する。選択部10は1周
波数変換した後の信号を加算して求めたエネルギーの結
果があらかじめ決められたエネルギーの閾値E、より大
きい時は、AGC回路2を通過しない方の信号によって
得られた音声始端信号を正しい音声始端として音声認識
処理部11へ送り、E2より小さい時はAGC回路2を
通過した方の音声始端信号を正しい音声始端として音声
認識処理部11へ発する。
第5図は、本発明の他の者施例を説明するためのブロッ
ク線図、第6図は、第5図の動作説明をするためのフロ
ーチャートで1図中、第1図及び第3図に示した実施例
と同様の作用をする部分には、第1図及び第3図の場合
と同一の参照番号が付しである。而して、この実施例は
、マイクロフォン1によって集音して電気信号に変換し
た電気信号を自動利得調整回路2を通した後周波数分析
し、その時間的な変化を求めると共に該電気信号のエネ
ルギーを求め、音声の始端は周波数分析結果の時間変化
によって決定し、終端はエネルギーの大きさで決めるよ
うにしたものである。この周波数スペクトルの時間変化
は音声冒頭で大きく変化し、音韻が変化する毎に変化し
、最後は音声が終り環境雑音が主になる所で変化が大き
くなる。
このため、変化が大きい点で音声終端を決めることが難
かしく音声終端は音の大きさを利用することが望ましい
。又、AGC回路を通過した信号では前述の通り音声終
了後、環境ノイズを引き上げるために終端検出は困難で
ある。
効   果 以上の説明から明らかなように、本発明によると、環境
ノイズがある中でも正しい音声区間が検出できる。
【図面の簡単な説明】
第1図は、本発明による音声区間検出方式の一実施例を
説明するためのブロック線図、第2図は、第1図の動作
説明をするためのフロ−チャート5第3図は、他の実施
例を説明をするためのブロック線図、第4図は、第3図
の動作説明をするためのフローチャート、第5図は、本
発明の更に他の実施例を説明するためのブロック線図、
第6図は、第5図の動作説明をするためのフローチャー
ト、第7図及び第8図は、従来技術の例を説明するため
の音声エネルギー波形図及び要部ブロック図である。 1・・・マイクロフォン、2・・・AGC回M、3.4
・・・フィルタ、5,6・・・検波回路、7〜9・・・
比較回路。 10・・・選択回路、11・・・音声認識処理装置、1
2・・・周波数変換回路、13・・・フィルタ及び検波
器。 14・・・差分検出部、15・・・エネルギー検出部。 特許出願人   株式会社 リコー 第  1 図 第2図 第3図 第 47 第5図 第  6 図 第  7 図

Claims (3)

    【特許請求の範囲】
  1. (1)音声を集音して電気信号に変換し、変換された信
    号中から音声に係る部分だけを抽出する音声検出方式に
    おいて、前記電気信号を自動利得調整(AGC)回路を
    通した後エネルギーを求める部分と、前記AGC回路を
    通過せずにエネルギーを求める部分を設け、音声を入力
    する前の状態で前記AGC回路を通過したエネルギーが
    大なる時は前記AGC回路を通過しないエネルギーが閾
    値を越える部分を音声区間とし、小なる時は前記AGC
    回路を通過したエネルギーが閾値を越える部分を音声区
    間とするようにしたことを特徴とする音声区間検出方式
  2. (2)音声を集音して電気信号に変換し、変換された信
    号中から音声に係る部分だけを抽出する音声検出方式に
    おいて、前記電気信号を自動利得調整(AGC)回路を
    通した後周波数分析してその時間的な変化を求めると共
    に該電気信号のエネルギーを求め、エネルギーの小さな
    部分では前記周波数分析結果の時間変化が大なる部分を
    音声の始点とし、前記AGC回路通過後のエネルギーの
    大きな部分では前記AGC回路を通過させない信号エネ
    ルギーが閾値を越えた部分を始点とするようにしたこと
    を特徴とする音声区間検出方式。
  3. (3)音声を集音して電気信号に変換し、変換された信
    号中から音声に係る部分だけを抽出する音声検出方式に
    おいて、前記電気信号を自動利得調整(AGC)回路を
    通した後周波数分析してその時間的な変化を求めると共
    に該電気信号のエネルギーを求め、音声の始端は周波数
    分析結果の時間変化によって決定し、終端はエネルギー
    の大きさで決めるようにしたことを特徴とする音声区間
    検出方式。
JP61274287A 1986-11-18 1986-11-18 音声区間検出方式 Pending JPS63127294A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61274287A JPS63127294A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61274287A JPS63127294A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Publications (1)

Publication Number Publication Date
JPS63127294A true JPS63127294A (ja) 1988-05-31

Family

ID=17539546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61274287A Pending JPS63127294A (ja) 1986-11-18 1986-11-18 音声区間検出方式

Country Status (1)

Country Link
JP (1) JPS63127294A (ja)

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
US20050091043A1 (en) Acoustic signal processor
JP2992324B2 (ja) 音声区間検出方法
JPS63127294A (ja) 音声区間検出方式
JPH02232697A (ja) 音声認識装置
WO2020238703A1 (zh) 获取语音信号的方法及装置
JPH0558551B2 (ja)
JPS63278100A (ja) 音声認識装置
KR100381372B1 (ko) 음성특징 추출장치
CN115691556B (zh) 一种设备端多通道语音质量的检测方法
JPH05100661A (ja) 小節境界時刻抽出装置
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPH0424692A (ja) 音声区間検出方式
JPS6022193A (ja) 音声認識装置
JPH04340598A (ja) 音声認識装置
JPS6367199B2 (ja)
JPS60101597A (ja) 音声区間検出装置
JPH0376471B2 (ja)
JPS6075900A (ja) 単語音声認識装置
JPS5872994A (ja) 信号入力装置
JPH04223497A (ja) 有音区間の検出方法
JPH02165198A (ja) 音声認識装置
JPS63226691A (ja) 標準パターン作成方式
JPH0297998A (ja) 音声判定方式