JPS603700A - 音声検出方式 - Google Patents
音声検出方式Info
- Publication number
- JPS603700A JPS603700A JP58112036A JP11203683A JPS603700A JP S603700 A JPS603700 A JP S603700A JP 58112036 A JP58112036 A JP 58112036A JP 11203683 A JP11203683 A JP 11203683A JP S603700 A JPS603700 A JP S603700A
- Authority
- JP
- Japan
- Prior art keywords
- section
- voice
- detection
- parameter
- voice detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明はマイクロホン等から入力される信号から音声区
間を検出するための音声検出方式に関する。
間を検出するための音声検出方式に関する。
第1図は音声検出を行うための基本稀酸を示すブロック
図であり、音声信号入力端子l、パラメータ算出部2、
比較部3、検出部4、レベル設定端子5及び出力端子6
から偶成されて(・る。音声入力信号は入力端子1を介
してパラメータ算出部2に与えられ一定時間毎に予め定
めた音声検出用パラメータに変換される。変換されたバ
シメータは比較部3で胞子5を介して設定されたレベル
設定値と比較され、その結果か検出部4に送られる。
図であり、音声信号入力端子l、パラメータ算出部2、
比較部3、検出部4、レベル設定端子5及び出力端子6
から偶成されて(・る。音声入力信号は入力端子1を介
してパラメータ算出部2に与えられ一定時間毎に予め定
めた音声検出用パラメータに変換される。変換されたバ
シメータは比較部3で胞子5を介して設定されたレベル
設定値と比較され、その結果か検出部4に送られる。
検出t″J1−4ではこの比較結果8をもとe(特定の
アルゴリズ五により音声区間の検出を行う。
アルゴリズ五により音声区間の検出を行う。
音声検出用パラメータとして音声パワーを用(・る従来
の検出方式を第2図(a)および(b)を参照して説明
する。同図(a)は、音声パワーが予め定めた閾値P1
を越えた時点を音声区間の始端Sa、閾値P1以下のパ
ワーが予め定めた時間L1以上続(・たときの最初に閾
値P1以下になった時点を音声区間の終端Eaと推定し
て音声区間を検出する例を示ず。また、同図[有])は
さらにもう一つ閾値P2を定めて、閾値P、に対する始
端saから時間を前方向に予め定めた時間L2さかのぼ
った範囲で、Gシ ハワが初めて閾値P2以下になる時点を音声区間の始端
8b、l?6値P1に対する終端Eaから時間L2を経
過した範囲で閾値P2以下のパワーが予め定めた時間L
3以上続いたときの最初にP2以下になった時点を音声
区間の終端Eb とする例を示す。
の検出方式を第2図(a)および(b)を参照して説明
する。同図(a)は、音声パワーが予め定めた閾値P1
を越えた時点を音声区間の始端Sa、閾値P1以下のパ
ワーが予め定めた時間L1以上続(・たときの最初に閾
値P1以下になった時点を音声区間の終端Eaと推定し
て音声区間を検出する例を示ず。また、同図[有])は
さらにもう一つ閾値P2を定めて、閾値P、に対する始
端saから時間を前方向に予め定めた時間L2さかのぼ
った範囲で、Gシ ハワが初めて閾値P2以下になる時点を音声区間の始端
8b、l?6値P1に対する終端Eaから時間L2を経
過した範囲で閾値P2以下のパワーが予め定めた時間L
3以上続いたときの最初にP2以下になった時点を音声
区間の終端Eb とする例を示す。
従来のパラメータ算出部2を示すブロック図で4゜
ある。端子lから与えられる入力信号はN側帯域通過フ
ィルタ20−1〜20−HによりN個の周波数成分に分
割されて演算部21に与えられる。演算部21では、予
め定めた時間毎に、各周波数成分のパワーChj(j=
1〜N)から(1)式に基づいて全パワーPaを計算す
る。
ィルタ20−1〜20−HによりN個の周波数成分に分
割されて演算部21に与えられる。演算部21では、予
め定めた時間毎に、各周波数成分のパワーChj(j=
1〜N)から(1)式に基づいて全パワーPaを計算す
る。
Pa−EChn ・・・・・・・・・・・・・・・(1
)この予め定めた時間毎に計算されるパワーPaが音声
区間の始端および終端を決定するためのパワーとして使
用される。
)この予め定めた時間毎に計算されるパワーPaが音声
区間の始端および終端を決定するためのパワーとして使
用される。
このようにパラメタ算出部として、従来は入力信号の全
パワーに比例した値が用(・られて(・る。このため、
入力信号に定n的i白色性雑音が重畳され、入力音声の
S/N比(信号対頼音比)が劣化したとき、パラメータ
算出部の出力の8ハ比も同じ割合で劣化し、正しい音声
区間の検出が行えな(・。
パワーに比例した値が用(・られて(・る。このため、
入力信号に定n的i白色性雑音が重畳され、入力音声の
S/N比(信号対頼音比)が劣化したとき、パラメータ
算出部の出力の8ハ比も同じ割合で劣化し、正しい音声
区間の検出が行えな(・。
本発明の目的は上述の欠点を除去した音声検出方式を提
供することにある。
供することにある。
本発明の方式は、予め定めた時間毎に音声検出用パラメ
ータを算出するパラメータ算出部と、該パラメータ算出
部から与えられる前記パラメータと予め設定した少なく
とも一つの閾値とを比較する比較部と、該比較部での比
較結果に基づいて音声区間の検出を行う検出部とを備え
、靜冊入力信号を複数の周波数帯域に分割し該複数の周
波数帯域のパワーレベルのうちの最大値レベルに基づ(
・て前記音声検出用パラメータを算出する。
ータを算出するパラメータ算出部と、該パラメータ算出
部から与えられる前記パラメータと予め設定した少なく
とも一つの閾値とを比較する比較部と、該比較部での比
較結果に基づいて音声区間の検出を行う検出部とを備え
、靜冊入力信号を複数の周波数帯域に分割し該複数の周
波数帯域のパワーレベルのうちの最大値レベルに基づ(
・て前記音声検出用パラメータを算出する。
次に本発明について図面を参照して詳細に説明 1する
。
。
第4図は本発明の方式に用いるパラメータ算出部2を示
すブロック図である。
すブロック図である。
入力端子1から与えられる入力信号はN(正整数)個の
帯域通過フィルタ200−1〜200−NによりN個0
周波数成分に分割されたあとセレクタ。
帯域通過フィルタ200−1〜200−NによりN個0
周波数成分に分割されたあとセレクタ。
201に出力される。セレクタ201は、予め定めた時
間毎に、各レベルり2(10−1〜200−Nから出力
される各周波数成分のレベルのうちの最大のもの”ma
xを出力する。セレクタ201からの出力Pmaxは、
第1図の比較部3で、この比較部3に予め設定しておい
た閾値P1と比較され、この比較結果を第1図の検出部
4に出力する。検出部4では、比V:部3からの比較結
果に基づいて、音声区間の始端および終端を検出する。
間毎に、各レベルり2(10−1〜200−Nから出力
される各周波数成分のレベルのうちの最大のもの”ma
xを出力する。セレクタ201からの出力Pmaxは、
第1図の比較部3で、この比較部3に予め設定しておい
た閾値P1と比較され、この比較結果を第1図の検出部
4に出力する。検出部4では、比V:部3からの比較結
果に基づいて、音声区間の始端および終端を検出する。
例えは、第2図(a)に示した例を使用する場合には、
まず、比較部3の出力r(より始端Saを検出したあと
、セレクタ201の出力すなわちセレクタ出力Pn1a
xが閾値P、以下になったときに検出部4で時間の剖測
を開始する。この計測開始後、時間L1以内に再びセレ
クタ出力”maxが閾値21以上に々りたときには計測
を中止し、再び閾値P、以下になったとき初期値から計
測を開始する。また、時間り。
まず、比較部3の出力r(より始端Saを検出したあと
、セレクタ201の出力すなわちセレクタ出力Pn1a
xが閾値P、以下になったときに検出部4で時間の剖測
を開始する。この計測開始後、時間L1以内に再びセレ
クタ出力”maxが閾値21以上に々りたときには計測
を中止し、再び閾値P、以下になったとき初期値から計
測を開始する。また、時間り。
が経過してもセレクタ出力が閾値28以上に外らなかっ
たときには現在の時点よりもり1時間前の時点を終端E
3として検出する。このようにして音声区間8 B −
E 3の検出が行われる。
たときには現在の時点よりもり1時間前の時点を終端E
3として検出する。このようにして音声区間8 B −
E 3の検出が行われる。
このように本発明の方式では、パラメータ算出部2のパ
ラメタとして入力信号の各周波数成分のパワーのうちの
最大のものを用(・て(・るため、パラメタの8/N比
は入力端子lに加えられた入力信号のS/N比よりも大
きくとることができ、従来の方式に比べ音声区間の検出
能力か向上する。
ラメタとして入力信号の各周波数成分のパワーのうちの
最大のものを用(・て(・るため、パラメタの8/N比
は入力端子lに加えられた入力信号のS/N比よりも大
きくとることができ、従来の方式に比べ音声区間の検出
能力か向上する。
以上、本発明には、従来方式では積置できない白色性雑
音中の音声区間を十分精度よく検出できると(・う効果
がある。
音中の音声区間を十分精度よく検出できると(・う効果
がある。
【図面の簡単な説明】
第1図は音声検出を行うための基本格成を示すブロック
図、第2図(alおよび由)はそれぞれ音声区間の定義
を説明するための図、第3図は従来方式に用〜・るパラ
メタ算出部を示すブロック図および第4図は本発ツJの
方式に用いるパラメタ規−出部を示すブロック図である
。 図にお(・て、1・・・・・・入力端子、2・・・・・
・パラメタ算出部、3・・・・・・比較部、4・・・・
・・検出部、5・−・・・・レベル設定値端子、6・・
・・・・出力端子、20−1〜2〇−N t 200−
1〜200−N・・・・・・フィルタ、21・・・・・
・演算部、201・・・・・・セレクタ。 \〜−−−一♂′
図、第2図(alおよび由)はそれぞれ音声区間の定義
を説明するための図、第3図は従来方式に用〜・るパラ
メタ算出部を示すブロック図および第4図は本発ツJの
方式に用いるパラメタ規−出部を示すブロック図である
。 図にお(・て、1・・・・・・入力端子、2・・・・・
・パラメタ算出部、3・・・・・・比較部、4・・・・
・・検出部、5・−・・・・レベル設定値端子、6・・
・・・・出力端子、20−1〜2〇−N t 200−
1〜200−N・・・・・・フィルタ、21・・・・・
・演算部、201・・・・・・セレクタ。 \〜−−−一♂′
Claims (1)
- 予め定めた時間毎に音声検出用パラメータを算出するパ
ラメータ算出部と、該パラメータ算出部部での比較結果
に基づ(・て音声区間の検出を行う検出部とを備え、W
入力信号を複数の周波数帯域に分割し該複数の周波数帯
域のパワーレベルのうちの最大のレベルに基づいて前記
音声検出用パラメータを算出することを特徴とする音声
検出方式。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58112036A JPS603700A (ja) | 1983-06-22 | 1983-06-22 | 音声検出方式 |
US06/620,742 US4718097A (en) | 1983-06-22 | 1984-06-14 | Method and apparatus for determining the endpoints of a speech utterance |
AU29500/84A AU588218B2 (en) | 1983-06-22 | 1984-06-19 | Method and apparatus for determining the endpoints of a speech utterance |
DE19843422877 DE3422877A1 (de) | 1983-06-22 | 1984-06-20 | Verfahren und vorrichtung zum ermitteln der endpunkte von sprachsignalen |
CA000457118A CA1218457A (en) | 1983-06-22 | 1984-06-21 | Method and apparatus for determining the endpoints of a speech utterance |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58112036A JPS603700A (ja) | 1983-06-22 | 1983-06-22 | 音声検出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS603700A true JPS603700A (ja) | 1985-01-10 |
Family
ID=14576396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58112036A Pending JPS603700A (ja) | 1983-06-22 | 1983-06-22 | 音声検出方式 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4718097A (ja) |
JP (1) | JPS603700A (ja) |
AU (1) | AU588218B2 (ja) |
CA (1) | CA1218457A (ja) |
DE (1) | DE3422877A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU583871B2 (en) * | 1984-12-31 | 1989-05-11 | Itt Industries, Inc. | Apparatus and method for automatic speech recognition |
DE3514286A1 (de) * | 1985-04-19 | 1986-10-23 | Siemens AG, 1000 Berlin und 8000 München | System zur erkennung einzeln gesprochener woerter |
US4833713A (en) * | 1985-09-06 | 1989-05-23 | Ricoh Company, Ltd. | Voice recognition system |
JPH01169499A (ja) * | 1987-12-24 | 1989-07-04 | Fujitsu Ltd | 単語音声区間切出し方式 |
JPH027099A (ja) * | 1988-06-27 | 1990-01-11 | Toshiba Corp | 過大音声検出装置 |
US5119432A (en) * | 1990-11-09 | 1992-06-02 | Visidyne, Inc. | Frequency division, energy comparison signal processing system |
US5261007A (en) * | 1990-11-09 | 1993-11-09 | Visidyne, Inc. | Frequency division, energy comparison signal processing system |
US5222190A (en) * | 1991-06-11 | 1993-06-22 | Texas Instruments Incorporated | Apparatus and method for identifying a speech pattern |
JPH05181827A (ja) * | 1991-12-28 | 1993-07-23 | Rohm Co Ltd | ファジィニューロンのカーディナル数拡張回路 |
US5617508A (en) * | 1992-10-05 | 1997-04-01 | Panasonic Technologies Inc. | Speech detection device for the detection of speech end points based on variance of frequency band limited energy |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
JPH07225593A (ja) * | 1994-02-10 | 1995-08-22 | Fuji Xerox Co Ltd | 音処理装置 |
JPH07226779A (ja) * | 1994-02-15 | 1995-08-22 | Nec Eng Ltd | 周波数検出回路 |
DE4422545A1 (de) * | 1994-06-28 | 1996-01-04 | Sel Alcatel Ag | Start-/Endpunkt-Detektion zur Worterkennung |
US6782365B1 (en) * | 1996-12-20 | 2004-08-24 | Qwest Communications International Inc. | Graphic interface system and product for editing encoded audio data |
US6134524A (en) * | 1997-10-24 | 2000-10-17 | Nortel Networks Corporation | Method and apparatus to detect and delimit foreground speech |
US6480823B1 (en) | 1998-03-24 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Speech detection for noisy conditions |
US10134425B1 (en) * | 2015-06-29 | 2018-11-20 | Amazon Technologies, Inc. | Direction-based speech endpointing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59228300A (ja) * | 1983-06-08 | 1984-12-21 | 株式会社リコー | 音声区間検出方式 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2237899A (en) * | 1940-04-27 | 1941-04-08 | Bell Telephone Labor Inc | Speech wave detecting circuit |
DE1797469A1 (de) * | 1959-02-07 | 1971-10-28 | Heinz Kusch | Einrichtung zur Extrahierung kennzeichnender Kriterien von Schwingungen,insbesondere Sprachschwingungen |
US3394309A (en) * | 1965-04-26 | 1968-07-23 | Rca Corp | Transient signal analyzer circuit |
US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
DE2536640C3 (de) * | 1975-08-16 | 1979-10-11 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur Erkennung von Geräuschen |
JPS6016582B2 (ja) * | 1977-03-04 | 1985-04-26 | 日本電気株式会社 | デイジタル周波数分析装置 |
CH635695A5 (de) * | 1978-08-31 | 1983-04-15 | Landis & Gyr Ag | Detektor zur feststellung der anwesenheit mindestens eines elektrischen signals mit einer vorbestimmten charakteristik. |
DE3101928C2 (de) * | 1981-01-22 | 1983-03-31 | Messerschmitt-Bölkow-Blohm GmbH, 8000 München | Vorrichtung für die Diskriminierung überfliegender Flugzeuge |
-
1983
- 1983-06-22 JP JP58112036A patent/JPS603700A/ja active Pending
-
1984
- 1984-06-14 US US06/620,742 patent/US4718097A/en not_active Expired - Lifetime
- 1984-06-19 AU AU29500/84A patent/AU588218B2/en not_active Ceased
- 1984-06-20 DE DE19843422877 patent/DE3422877A1/de active Granted
- 1984-06-21 CA CA000457118A patent/CA1218457A/en not_active Expired
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59228300A (ja) * | 1983-06-08 | 1984-12-21 | 株式会社リコー | 音声区間検出方式 |
Also Published As
Publication number | Publication date |
---|---|
AU588218B2 (en) | 1989-09-14 |
DE3422877C2 (ja) | 1988-03-31 |
CA1218457A (en) | 1987-02-24 |
DE3422877A1 (de) | 1985-01-10 |
US4718097A (en) | 1988-01-05 |
AU2950084A (en) | 1985-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS603700A (ja) | 音声検出方式 | |
JPS59226846A (ja) | 内燃機関のノツキング検出方法及び装置 | |
US5796336A (en) | Glass breakage detecting device | |
JPS6329754B2 (ja) | ||
JP2000131196A (ja) | 発電機のリップルばねの緩み検査装置 | |
JPH07184948A (ja) | いびき検出装置 | |
JP3134557B2 (ja) | ハウリング抑制装置 | |
JPS60112314A (ja) | 電圧変動検出回路 | |
EP0348888B1 (en) | Overflow speech detecting apparatus | |
JPH08166421A (ja) | 部分放電測定方法 | |
JPH06261391A (ja) | ハウリング抑制装置 | |
JP3056048B2 (ja) | いびき検出装置 | |
JPS6147437B2 (ja) | ||
JPH0588839B2 (ja) | ||
JP3983421B2 (ja) | 音声認識装置 | |
JPS62141595A (ja) | 音声検出方式 | |
JPH02176796A (ja) | 音声認識装置 | |
US7596238B2 (en) | Howling margin measuring device | |
JPH0823756B2 (ja) | 音声区間検出方式 | |
JPH0240700A (ja) | 音声検出装置 | |
JPS6015143Y2 (ja) | 航空機騒音判定装置 | |
JPS62123499A (ja) | 音声区間検出方式 | |
JPH03253899A (ja) | 音声区間検出方式 | |
JPH02137153A (ja) | テープレコーダ | |
JPS60144669A (ja) | 信号周波数変化の検出装置 |