JP2000267690A - 音声検知装置及び音声制御システム - Google Patents

音声検知装置及び音声制御システム

Info

Publication number
JP2000267690A
JP2000267690A JP11076008A JP7600899A JP2000267690A JP 2000267690 A JP2000267690 A JP 2000267690A JP 11076008 A JP11076008 A JP 11076008A JP 7600899 A JP7600899 A JP 7600899A JP 2000267690 A JP2000267690 A JP 2000267690A
Authority
JP
Japan
Prior art keywords
voice
input
detection
duration
status signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP11076008A
Other languages
English (en)
Inventor
Keigo Namikawa
川 圭 吾 南
Masaki Saito
藤 昌 樹 齋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11076008A priority Critical patent/JP2000267690A/ja
Priority to TW089104368A priority patent/TW567666B/zh
Priority to KR1020000013851A priority patent/KR100335161B1/ko
Priority to US09/531,445 priority patent/US6574592B1/en
Publication of JP2000267690A publication Critical patent/JP2000267690A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/40Casings; Connections of working fluid
    • F04D29/42Casings; Connections of working fluid for radial or helico-centrifugal pumps
    • F04D29/44Fluid-guiding means, e.g. diffusers
    • F04D29/441Fluid-guiding means, e.g. diffusers especially adapted for elastic fluid pumps
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/40Casings; Connections of working fluid
    • F04D29/42Casings; Connections of working fluid for radial or helico-centrifugal pumps
    • F04D29/4206Casings; Connections of working fluid for radial or helico-centrifugal pumps especially adapted for elastic fluid pumps
    • F04D29/4226Fan casings
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Selective Calling Equipment (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 入力される音声の周波数、大きさ、長さ等、
音声の種類を制限することにより、簡易な構成で低コス
トな音声検知装置及び音声制御システムを提供する。 【解決手段】 本発明に係る音声検知装置は、入力され
た音声の周波数を検知し、設定された検知音声周波数範
囲内の周波数であるか否かを識別して、その識別結果を
出力する音声周波数検知部と、入力された音声のエネル
ギレベルを検知し、設定された検知音声エネルギレベル
閾値の範囲内か否かの比較を行い、その比較結果を出力
する入力信号レベル検知部と、上記識別結果及び比較結
果に基づき、音声検知条件に適合する音声が入力された
か否かを判断し、その判断結果に応じて第一のステイタ
ス信号を出力する音声入力判断部と、第一のステイタス
信号の継続時間を測定し、設定された継続時間閾値の範
囲内か否かの比較を行い、その比較結果に応じて第二の
ステイタス信号を出力する音声継続時間測定部とを備え
たものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通常手動制御を必
要とする装置に対し所定の音声による遠隔制御のための
音声検知を行う音声検知装置及びその音声検知装置を用
いた音声制御システムに関する。
【0002】
【従来の技術】通常手動制御を必要とする装置に対し音
声による遠隔制御を行う従来技術として、音声検知を利
用した音声制御システムがある。
【0003】図3は、従来の音声制御システムの構成を
示したブロック図である。
【0004】図3に示した従来の音声制御システムは、
音声を入力するためのマイクロホン30と、入力された
音声の検知及び識別、識別結果に基づく制御等の処理を
行うパーソナルコンピュータ31とにより構成されてい
る。
【0005】パーソナルコンピュータ31には、各種演
算処理を行う中央処理装置(CPU)32と、各種デー
タを記憶するメモリ33と、音声検知により制御される
制御対象ブロック34と、その他のブロック35とが備
えられている。
【0006】音声検知による制御を行う場合には、メモ
リ33に、入力された音声のデータと比較してその音声
の検知及び識別を行うための複数の比較音声データを格
納しておく。また、CPU32の一部を、入力された音
声の検知及び識別並びに識別結果に基づく制御を行う音
声検知ブロック32aとして使用する。
【0007】マイクロホン30から、不特定話者による
複数の単語又は文節の音声が入力されると、その入力音
声データを音声検知ブロック32aが検知し、メモリ3
3から読み出した各比較音声データと比較して一致する
ものがあるか否かの識別を行う。入力音声データと一致
する比較音声データがある場合には、その比較音声デー
タに対応する制御命令(操作コマンド)を制御対象ブロ
ック34に対し出力する。制御命令が入力された制御対
象ブロック34は、その制御命令に応じた動作を行う。
【0008】
【発明が解決しようとする課題】上述のような音声制御
システムにおいては、数十MIPSから数百MIPSの
演算処理能力と数十kBのメモリリソースとを必要とす
るが、パーソナルコンピュータのように大規模なシステ
ムであれば、音声検知のために使用するリソース(資
源)はシステム全体の最大リソースの一部にすぎず、シ
ステムの肥大化やコスト増大を招くことはない。
【0009】これに対して、わずかの操作コマンドの検
知だけで足りるような小規模システムにおいては、パー
ソナルコンピュータで使用されるような大規模な音声検
知システムは必要ではない。極端な場合、たった1つの
操作を達成するだけの低価格な音声検知手段が必要な場
合もある。
【0010】しかし、従来、不特定話者について、単語
又は文節の音声検知を行う場合、その実現のためには、
CPUの演算処理能力やメモリ容量等、必要とされる資
源が膨大となり、音声による遠隔制御可能なシステムの
コストやシステム規模の増大を招いていた。
【0011】本発明は上記問題点に鑑みてなされたもの
で、その目的は、入力される音声の周波数、大きさ、長
さ等、音声の種類を制限することにより、簡易な構成で
低コストな音声検知装置及び音声制御システムを提供す
ることである。
【0012】
【課題を解決するための手段】本発明に係る音声検知装
置によれば、入力された音声の周波数を検知し、設定さ
れた検知音声周波数範囲内の周波数であるか否かを識別
して、その識別結果を出力する音声周波数検知部と、入
力された音声のエネルギレベルを検知し、設定された検
知音声エネルギレベル閾値を超えているか否かの比較を
行い、その比較結果を出力する入力信号レベル検知部
と、音声周波数検知部の識別結果及び入力信号レベル検
知部の比較結果に基づき、音声検知条件に適合する音声
が入力されたか否かを判断し、その判断結果に応じて第
一のステイタス信号を出力する音声入力判断部と、第一
のステイタス信号の継続時間を測定し、設定された継続
時間閾値を超えているか否かの比較を行い、その比較結
果に応じて第二のステイタス信号を出力する音声継続時
間測定部とを備えたことを特徴とし、この構成により、
通常手動制御を必要とする装置に対する不特定話者の音
声による遠隔制御を行うための音声検知装置を、簡易な
構成で安価に提供することができる。
【0013】検知音声周波数範囲、検知音声エネルギレ
ベル閾値及び継続時間閾値の設定は、それぞれ変更可能
であるものとすると、目的に応じて検知対象音声を制限
することができる。
【0014】本発明に係る音声制御システムによれば、
音声を入力するためのマイクロホンと、本発明に係る音
声検知装置と、第一のステイタス信号及び第二のステイ
タス信号のいずれか一方又は両方に応じて制御命令を出
力するか否かを決定する制御手段と、制御命令に応じた
動作を行う制御対象とを備えたことを特徴とし、この構
成により、通常手動制御を必要とする装置に対する不特
定話者の音声による遠隔制御を行う音声制御システム
を、簡易な構成で安価に提供することができる。
【0015】
【発明の実施の形態】以下、本発明に係る音声検知装置
及び音声制御システムの実施の形態について、図面を参
照しながら説明する。
【0016】図1は、本発明に係る音声制御システムの
構成を示したブロック図である。
【0017】図1に示した本発明に係る音声制御システ
ムは、音声を入力するためのマイクロホン10と、入力
された音声の検知、及び、検知結果に基づく音声検知ス
テイタス信号の出力を行う音声検知ブロック11と、音
声検知の条件設定、及び、音声検知ステイタス信号に対
応した制御命令の出力を行う制御手段12と、音声検知
に基づく制御命令により制御される制御対象ブロック1
3とから構成されている。音声検知ブロック11は、以
下に説明する本発明に係る音声検知装置により構成す
る。音声検知ブロック11における音声検知の条件設定
は、制御手段12により行う。
【0018】本発明に係る音声制御システムは、マイク
ロホン10から入力される音声が、音声検知ブロック1
1における音声検知の設定条件に適合する音声であるこ
とが検知されると、音声検知ブロック11は検知された
音声に応じた音声検知ステイタス信号を制御手段12に
対し出力する。制御手段12は、入力された音声検知ス
テイタス信号に応じた制御命令を制御対象ブロック13
に対し出力し、制御命令が入力された制御対象ブロック
13は、その制御命令に応じた動作を行う。
【0019】図2は、本発明に係る音声検知装置の構成
を示したブロック図である。図1における音声検知ブロ
ック11は、本発明に係る音声検知装置により構成され
る。図2に示した本発明に係る音声検知装置(音声検知
ブロック11)は、マイクロホン10から入力された音
声の周波数を検知し、設定された検知音声周波数範囲内
の周波数であるか否かを識別して、その識別結果を出力
する音声周波数検知部20と、マイクロホン10から入
力された音声のエネルギレベルを検知し、設定された検
知音声エネルギレベル閾値を超えているか否かの比較を
行い、その比較結果を出力する入力信号レベル検知部2
1と、音声周波数検知部20の識別結果及び入力信号レ
ベル検知部21の比較結果に基づき、音声検知条件に適
合する音声が入力されたことを判断し、その判断結果に
応じてステイタス信号Aを出力する音声入力判断部22
と、ステイタス信号Aの継続時間を測定し、設定された
継続時間閾値を超えているか否かの比較を行い、その比
較結果に応じてステイタス信号Bを出力する音声継続時
間測定部23と、音声入力判断部22から入力されたス
テイタス信号A及び音声継続時間測定部23から入力さ
れたステイタス信号Bを音声検知ステイタス信号とし
て、制御手段12に対し出力するステイタス出力部24
とから構成されている。
【0020】本発明に係る音声検知装置の動作は、以下
の通りである。
【0021】音声周波数検知部20は、制御手段12
(図1参照)によって設定される周波数閾値20aを有
するフィルタである。マイクロホン10から入力された
音声の周波数を、その音声のエネルギ成分を検知するこ
とにより、周波数閾値20aにより定められる検知音声
周波数範囲の上限及び下限の範囲内の周波数であるか否
かを監視して識別し、入力音声の周波数が検知条件に合
致するか否かの識別結果を音声入力判断部22に対して
出力する。
【0022】入力信号レベル検知部21は、マイクロホ
ン10から入力された音声のエネルギレベルを検知し、
制御手段12により設定された検知エネルギレベル閾値
21aを超えているか否かの比較を行い、その比較結果
を音声入力判断部22に対して出力する。
【0023】音声入力判断部22は、音声周波数検知部
20及び入力信号レベル検知部21からの出力に基づ
き、音声周波数検知部20の識別結果及び入力信号レベ
ル検知部21の比較結果がいずれも音声検知条件に合致
したときに、音声検知条件に適合する音声が入力された
と判断してステイタス信号Aを、音声継続時間測定部2
3及びステイタス出力部24に対し出力する。
【0024】音声継続時間測定部23は、音声入力判断
部22から入力されるステイタス信号Aの継続時間を測
定し、制御手段12により設定された継続時間閾値23
aを超えているか否かの比較を行い、その比較の結果、
継続時間閾値を超えているときはステイタス信号Bをス
テイタス出力部24に対し出力する。
【0025】ステイタス出力部24は、入力されたステ
イタス信号A及びステイタス信号Bを音声検知ステイタ
ス信号として制御手段12に対しそれぞれ出力する。図
2に示した例においては、説明の便宜上、ステイタス出
力部24を設けているが、音声入力判断部22からステ
イタス信号Aを、音声継続時間測定部23からステイタ
ス信号Bを、それぞれ直接制御手段12に対し出力する
ようにしてもよい。
【0026】尚、本実施の形態のように、ステイタス信
号Aの継続時間が継続時間閾値を超えているときにステ
イタス信号Bを出力する音声継続時間測定部23が音声
検知装置内部に備えられている場合には、ステイタス信
号Aは外部に出力する必要はない。従って、音声入力判
断部22からステイタス出力部24にステイタス信号A
を出力する必要もない。一方、音声継続時間測定部23
が音声検知装置内部に備えられておらず、制御手段12
等、音声検知装置外部に備えられている場合には、ステ
イタス信号Aを外部に出力し、外部でその継続時間を測
定するようにするとよい。
【0027】図1における制御手段12は、音声検知ブ
ロック11から音声検知ステイタス信号として入力され
るステイタス信号A又はステイタス信号Bのいずれか一
方又は両方に応じて、制御対象ブロック13に対し制御
命令を出力するか否かを決定する。通常は、音声の周波
数、エネルギレベル及び継続時間の総ての音声検知条件
が満たされて、音声検知ブロック11から音声検知ステ
イタス信号としてステイタス信号Bが入力されたとき
に、制御対象ブロック13に対し所定の制御命令を出力
する。
【0028】様々な話者の音声による音声制御において
は、音声周波数検知部20における検知音声周波数範囲
の設定変更を行うことにより、単数又は複数の特定話者
の音声によってのみ音声制御を可能としたり、不特定多
数の話者の音声によって音声制御を可能とすることがで
きる。
【0029】また、入力信号レベル検知部21における
検知エネルギレベル閾値の設定変更により、音声以外の
ノイズ等の誤検知を防止したり、一定レベル以下の小さ
い音声の検知を排除することができる。
【0030】さらに、音声継続時間測定部23における
継続時間閾値の設定変更により、制御ブロック12にお
けるタイマ又はカウンタの処理負荷を軽減したり、一定
範囲内の長さの音声だけを検知することができる。
【0031】以上のように、本発明に係る音声検知装置
及び音声制御システムにおいては、検知対象の音声の周
波数、大きさ、長さに対して検知可能な音声の周波数の
範囲、大きさの閾値、長さの範囲の設定の変更が可能で
あるので、通常手動制御を必要とする装置に対する不特
定話者の音声による遠隔制御を、簡易な構成で低コスト
な装置を用いて行うことができる。
【0032】
【発明の効果】本発明に係る音声検知装置によれば、入
力された音声の周波数を検知し、設定された検知音声周
波数範囲内の周波数であるか否かを識別して、その識別
結果を出力する音声周波数検知部と、入力された音声の
エネルギレベルを検知し、設定された検知音声エネルギ
レベル閾値を超えているか否かの比較を行い、その比較
結果を出力する入力信号レベル検知部と、音声周波数検
知部の識別結果及び入力信号レベル検知部の比較結果に
基づき、音声検知条件に適合する音声が入力されたか否
かを判断し、その判断結果に応じて第一のステイタス信
号を出力する音声入力判断部と、第一のステイタス信号
の継続時間を測定し、設定された継続時間閾値を超えて
いるか否かの比較を行い、その比較結果に応じて第二の
ステイタス信号を出力する音声継続時間測定部とを備え
たものとしたので、検知音声を周波数、大きさ、長さ等
の検知条件で制限することにより、従来技術に比べて辞
書メモリや複雑な検知アルゴリズムに起因する膨大な演
算量を大幅に削減することができ、簡易かつ軽微なシス
テムリソース及び低コストで、音声制御を実現すること
ができる。
【0033】また、検知対象の音声の周波数に対して検
知音声周波数範囲の設定の変更が可能であるので、特定
の話者や、話者の性別等にある程度対応した検知が可能
となる。
【0034】さらに、検知対象の音声の大きさに対して
レベル閾値の設定の変更が可能であるので、音声以外の
ノイズ等の誤検知を防止したり、一定レベル以下の小さ
い音声の検知を排除することができる。
【0035】加えて、検知対象の音声の継続時間閾値の
設定の変更が可能であるので、制御手段におけるタイマ
又はカウンタの処理負荷を軽減したり、一定範囲内の長
さの音声だけを検知して誤検知を防止することができ
る。
【図面の簡単な説明】
【図1】本発明に係る音声制御システムの構成を示した
ブロック図。
【図2】本発明に係る音声検知装置の構成を示したブロ
ック図。
【図3】従来の音声制御システムの構成を示したブロッ
ク図。
【符号の説明】
10 マイクロホン 11 音声検知ブロック 12 制御手段 13 制御対象ブロック 20 音声周波数検知部 20a 周波数閾値 21 入力信号レベル検知部 21a 検知エネルギレベル閾値 22 音声入力判断部 23 音声継続時間測定部 23a 継続時間閾値 24 ステイタス出力部 30 マイクロホン 31 パーソナルコンピュータ 32 中央処理装置(CPU) 33 メモリ 34 制御対象ブロック 35 その他のブロック
【手続補正書】
【提出日】平成11年5月11日(1999.5.1
1)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正内容】
【0012】
【課題を解決するための手段】本発明に係る音声検知装
置によれば、入力された音声の周波数を検知し、設定さ
れた検知音声周波数範囲内の周波数であるか否かを識別
して、その識別結果を出力する音声周波数検知部と、入
力された音声のエネルギレベルを検知し、設定された検
知音声エネルギレベル閾値の範囲内か否かの比較を行
い、その比較結果を出力する入力信号レベル検知部と、
音声周波数検知部の識別結果及び入力信号レベル検知部
の比較結果に基づき、音声検知条件に適合する音声が入
力されたか否かを判断し、その判断結果に応じて第一の
ステイタス信号を出力する音声入力判断部と、第一のス
テイタス信号の継続時間を測定し、設定された継続時間
閾値の範囲内か否かの比較を行い、その比較結果に応じ
て第二のステイタス信号を出力する音声継続時間測定部
とを備えたことを特徴とし、この構成により、通常手動
制御を必要とする装置に対する不特定話者の音声による
遠隔制御を行うための音声検知装置を、簡易な構成で安
価に提供することができる。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正内容】
【0019】図2は、本発明に係る音声検知装置の構成
を示したブロック図である。図1における音声検知ブロ
ック11は、本発明に係る音声検知装置により構成され
る。図2に示した本発明に係る音声検知装置(音声検知
ブロック11)は、マイクロホン10から入力された音
声の周波数を検知し、設定された検知音声周波数範囲内
の周波数であるか否かを識別して、その識別結果を出力
する音声周波数検知部20と、マイクロホン10から入
力された音声のエネルギレベルを検知し、設定された検
知音声エネルギレベル閾値の範囲内か否かの比較を行
い、その比較結果を出力する入力信号レベル検知部21
と、音声周波数検知部20の識別結果及び入力信号レベ
ル検知部21の比較結果に基づき、音声検知条件に適合
する音声が入力されたことを判断し、その判断結果に応
じてステイタス信号Aを出力する音声入力判断部22
と、ステイタス信号Aの継続時間を測定し、設定された
継続時間閾値の範囲内か否かの比較を行い、その比較結
果に応じてステイタス信号Bを出力する音声継続時間測
定部23と、音声入力判断部22から入力されたステイ
タス信号A及び音声継続時間測定部23から入力された
ステイタス信号Bを音声検知ステイタス信号として、制
御手段12に対し出力するステイタス出力部24とから
構成されている。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0022
【補正方法】変更
【補正内容】
【0022】入力信号レベル検知部21は、マイクロホ
ン10から入力された音声のエネルギレベルを検知し、
制御手段12により設定された検知エネルギレベル閾値
21aの範囲内か否かの比較を行い、その比較結果を音
声入力判断部22に対して出力する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0024
【補正方法】変更
【補正内容】
【0024】音声継続時間測定部23は、音声入力判断
部22から入力されるステイタス信号Aの継続時間を測
定し、制御手段12により設定された継続時間閾値23
の範囲内か否かの比較を行い、その比較の結果、継続
時間閾値の範囲外であるときはステイタス信号Bをステ
イタス出力部24に対し出力する。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0026
【補正方法】変更
【補正内容】
【0026】尚、本実施の形態のように、ステイタス信
号Aの継続時間が継続時間閾値の範囲内であるときにス
テイタス信号Bを出力する音声継続時間測定部23が
御装置等の音声検知装置部に備えられている場合に
は、制御手段等は音声検知装置から出力されるステイタ
ス信号Aを独自の音声継続時間測定部に取り込み、その
継続時間を測定することにより、制御手段等の独自の継
続時間閾値で音声の到来を確認することができる。従っ
てこの場合は、制御手段等はステイタス信号Bを監視す
る必要はない。一方、音声継続時間測定部23が制御手
段等の音声検知装置外部に備えられていない場合には、
制御手段等が音声検知装置の継続時間閾値を設定し、出
力されるステイタス信号Bを監視することにより音声の
到来を確認することができる。従ってこの場合は、制御
手段等はステイタス信号Aを監視する必要はない。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0032
【補正方法】変更
【補正内容】
【0032】
【発明の効果】本発明に係る音声検知装置によれば、入
力された音声の周波数を検知し、設定された検知音声周
波数範囲内の周波数であるか否かを識別して、その識別
結果を出力する音声周波数検知部と、入力された音声の
エネルギレベルを検知し、設定された検知音声エネルギ
レベル閾値の範囲内か否かの比較を行い、その比較結果
を出力する入力信号レベル検知部と、音声周波数検知部
の識別結果及び入力信号レベル検知部の比較結果に基づ
き、音声検知条件に適合する音声が入力されたか否かを
判断し、その判断結果に応じて第一のステイタス信号を
出力する音声入力判断部と、第一のステイタス信号の継
続時間を測定し、設定された継続時間閾値の範囲内か
かの比較を行い、その比較結果に応じて第二のステイタ
ス信号を出力する音声継続時間測定部とを備えたものと
したので、検知音声を周波数、大きさ、長さ等の検知条
件で制限することにより、従来技術に比べて辞書メモリ
や複雑な検知アルゴリズムに起因する膨大な演算量を大
幅に削減することができ、簡易かつ軽微なシステムリソ
ース及び低コストで、音声制御を実現することができ
る。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力された音声の周波数を検知し、設定さ
    れた検知音声周波数範囲内の周波数であるか否かを識別
    して、その識別結果を出力する音声周波数検知部と、 入力された音声のエネルギレベルを検知し、設定された
    検知音声エネルギレベル閾値を超えているか否かの比較
    を行い、その比較結果を出力する入力信号レベル検知部
    と、 前記音声周波数検知部の識別結果及び前記入力信号レベ
    ル検知部の比較結果に基づき、音声検知条件に適合する
    音声が入力されたか否かを判断し、その判断結果に応じ
    て第一のステイタス信号を出力する音声入力判断部と、 前記第一のステイタス信号の継続時間を測定し、設定さ
    れた継続時間閾値を超えているか否かの比較を行い、そ
    の比較結果に応じて第二のステイタス信号を出力する音
    声継続時間測定部と、を備えたことを特徴とする音声検
    知装置。
  2. 【請求項2】音声を入力するためのマイクロホンと、 入力された音声の周波数を検知し、設定された検知音声
    周波数範囲内の周波数であるか否かを識別して、その識
    別結果を出力する音声周波数検知部、入力された音声の
    エネルギレベルを検知し、設定された検知音声エネルギ
    レベル閾値を超えているか否かの比較を行い、その比較
    結果を出力する入力信号レベル検知部、前記音声周波数
    検知部の識別結果及び前記入力信号レベル検知部の比較
    結果に基づき、音声検知条件に適合する音声が入力され
    たか否かを判断し、その判断結果に応じて第一のステイ
    タス信号を出力する音声入力判断部、並びに、前記第一
    のステイタス信号の継続時間を測定し、設定された継続
    時間閾値を超えているか否かの比較を行い、その比較結
    果に応じて第二のステイタス信号を出力する音声継続時
    間測定部を備えた音声検知装置と、 前記第一のステイタス信号及び前記第二のステイタス信
    号のいずれか一方又は両方に応じて制御命令を出力する
    か否かを決定する制御手段と、 前記制御命令に応じた動作を行う制御対象と、を備えた
    ことを特徴とする音声制御システム。
  3. 【請求項3】前記検知音声周波数範囲、前記検知音声エ
    ネルギレベル閾値及び前記継続時間閾値の設定は、前記
    制御手段により行われることを特徴とする請求項2に記
    載の音声制御システム。
JP11076008A 1999-03-19 1999-03-19 音声検知装置及び音声制御システム Abandoned JP2000267690A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP11076008A JP2000267690A (ja) 1999-03-19 1999-03-19 音声検知装置及び音声制御システム
TW089104368A TW567666B (en) 1999-03-19 2000-03-10 Acoustic detection apparatus and acoustic control system
KR1020000013851A KR100335161B1 (ko) 1999-03-19 2000-03-18 음성검지장치 및 음성제어시스템
US09/531,445 US6574592B1 (en) 1999-03-19 2000-03-20 Voice detecting and voice control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11076008A JP2000267690A (ja) 1999-03-19 1999-03-19 音声検知装置及び音声制御システム

Publications (1)

Publication Number Publication Date
JP2000267690A true JP2000267690A (ja) 2000-09-29

Family

ID=13592797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11076008A Abandoned JP2000267690A (ja) 1999-03-19 1999-03-19 音声検知装置及び音声制御システム

Country Status (4)

Country Link
US (1) US6574592B1 (ja)
JP (1) JP2000267690A (ja)
KR (1) KR100335161B1 (ja)
TW (1) TW567666B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326149A (zh) * 2020-02-25 2020-06-23 青岛海尔空调器有限总公司 一种提高语音辨识率的优化方法及系统

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8648692B2 (en) 1999-07-23 2014-02-11 Seong Sang Investments Llc Accessing an automobile with a transponder
US7136630B2 (en) * 2000-12-22 2006-11-14 Broadcom Corporation Methods of recording voice signals in a mobile set
US6983299B1 (en) * 2001-08-28 2006-01-03 Lsi Logic Corporation Programmable digital filter implementation for loss-of-signal detection for serial communications applications
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
DE602004020872D1 (de) * 2003-02-25 2009-06-10 Oticon As T in einer kommunikationseinrichtung
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
KR100714721B1 (ko) * 2005-02-04 2007-05-04 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US20190362725A1 (en) 2005-08-17 2019-11-28 Tamiras Per Pte. Ltd., Llc Providing access with a portable device and voice commands
CN1835075B (zh) * 2006-04-07 2011-06-29 安徽中科大讯飞信息科技有限公司 一种结合自然样本挑选与声学参数建模的语音合成方法
WO2008019080A1 (en) * 2006-08-04 2008-02-14 Jps Communications, Inc. Voice modulation recognition in a radio-to-sip adapter
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
CN102160359B (zh) 2008-09-18 2015-07-08 皇家飞利浦电子股份有限公司 控制系统的方法和信号处理系统
US8156517B2 (en) * 2008-12-30 2012-04-10 The Nielsen Company (U.S.), Llc Methods and apparatus to enforce a power off state of an audience measurement device during shipping
US8375404B2 (en) 2008-12-30 2013-02-12 The Nielsen Company (Us), Llc Methods and apparatus to enforce a power off state of an audience measurement device during shipping
US20110051557A1 (en) * 2009-08-26 2011-03-03 Nathalia Peixoto Apparatus and Method for Control Using a Humming Frequency
TWI412019B (zh) 2010-12-03 2013-10-11 Ind Tech Res Inst 聲音事件偵測模組及其方法
US9460706B1 (en) * 2012-10-05 2016-10-04 Symantec Corporation Systems and methods for executing anti-theft procedures for a device
CN104978955A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统
CN104978956A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统
CN104075410B (zh) * 2014-06-26 2017-02-15 美的集团股份有限公司 基于音频信号的终端控制方法和系统
US10360926B2 (en) * 2014-07-10 2019-07-23 Analog Devices Global Unlimited Company Low-complexity voice activity detection
US9654891B2 (en) 2015-09-15 2017-05-16 D&M Holdings, Inc. System and method for determining proximity of a controller to a media rendering device
KR20180082033A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 음성을 인식하는 전자 장치
CN110663258B (zh) * 2017-05-19 2021-08-03 铁三角有限公司 语音信号处理装置
CN109273005B (zh) * 2018-12-11 2024-10-01 胡应章 声音控制输出装置
CN112104949B (zh) * 2020-09-02 2022-05-27 北京字节跳动网络技术有限公司 用于检测拾音组件的方法、装置和电子设备
CN112181350B (zh) * 2020-09-25 2023-08-15 北京博睿维讯科技有限公司 一种主动式的终端控制方法与装置
CN113280912B (zh) * 2021-06-09 2024-03-05 湛江港(集团)股份有限公司 一种工业企业厂界多维度噪声监测系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5272504A (en) * 1975-12-15 1977-06-17 Fuji Xerox Co Ltd Device for recognizing word audio
JPS5513562A (en) 1978-07-17 1980-01-30 Itsuki Ban Remote control unit using acoustic wave as medium
CH633903A5 (de) * 1978-09-26 1982-12-31 Feller Ag Sprachschalter fuer ein an eine telefonleitung anzuschliessendes geraet.
JPS61271781A (ja) 1985-05-27 1986-12-02 株式会社セコー技研 音波によりランプの点灯を制御する装置
JPH0671346B2 (ja) 1986-01-23 1994-09-07 株式会社セコー技研 音波によるリモ−トコントロ−ル装置
US5548647A (en) * 1987-04-03 1996-08-20 Texas Instruments Incorporated Fixed text speaker verification method and apparatus
JPH09261007A (ja) * 1996-03-27 1997-10-03 Sony Corp デジタルフィルタ装置
JP3687181B2 (ja) * 1996-04-15 2005-08-24 ソニー株式会社 有声音/無声音判定方法及び装置、並びに音声符号化方法
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6182035B1 (en) * 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326149A (zh) * 2020-02-25 2020-06-23 青岛海尔空调器有限总公司 一种提高语音辨识率的优化方法及系统

Also Published As

Publication number Publication date
KR100335161B1 (ko) 2002-05-03
US6574592B1 (en) 2003-06-03
KR20000076912A (ko) 2000-12-26
TW567666B (en) 2003-12-21

Similar Documents

Publication Publication Date Title
JP2000267690A (ja) 音声検知装置及び音声制御システム
US10609482B2 (en) Speaker operation checking device and method
US11270707B2 (en) Analysing speech signals
US20200227071A1 (en) Analysing speech signals
US6826533B2 (en) Speech recognition apparatus and method
US20220036896A1 (en) Hybrid voice command technique utilizing both on-device and cloud resources
CN110491419B (zh) 一种播放控制方法、系统及终端设备
US20190355380A1 (en) Audio signal processing
US10236000B2 (en) Circuit and method for speech recognition
WO2020003785A1 (ja) 音声処理装置、音声処理方法及び記録媒体
US20110123056A1 (en) Fully learning classification system and method for hearing aids
US10818298B2 (en) Audio processing
WO2022022211A1 (zh) 基于语音控制的音量调节方法和装置
JP2005024869A (ja) 音声応答装置
US20210067167A1 (en) Recording device and recording method
CN111739493A (zh) 音频处理方法、装置及存储介质
US9628892B2 (en) Method of determining operation mode of hearing device and hearing device
GB2553040A (en) Sensor input recognition
CN114040293B (zh) 耳机控制方法、装置、耳机及计算机可读存储介质
KR102173841B1 (ko) 복수의 인공지능 음성단말장치를 이용하여 구역별 전자장치를 제어하는 시스템 및 방법
US20220215854A1 (en) Speech sound response device and speech sound response method
JPH07225592A (ja) 有音区間検出装置
JP2005181439A (ja) 音声認識装置
TW202226225A (zh) 以零點交越檢測改進語音活動檢測之設備及方法
CN116095587A (zh) 扬声器自检测方法、装置、扬声器设备及存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041217

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20050207