JPH0222398B2 - - Google Patents

Info

Publication number
JPH0222398B2
JPH0222398B2 JP56175431A JP17543181A JPH0222398B2 JP H0222398 B2 JPH0222398 B2 JP H0222398B2 JP 56175431 A JP56175431 A JP 56175431A JP 17543181 A JP17543181 A JP 17543181A JP H0222398 B2 JPH0222398 B2 JP H0222398B2
Authority
JP
Japan
Prior art keywords
voice
section
value
parameter
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56175431A
Other languages
English (en)
Other versions
JPS5876899A (ja
Inventor
Tomio Sakata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56175431A priority Critical patent/JPS5876899A/ja
Priority to US06/412,234 priority patent/US4535473A/en
Priority to GB08225301A priority patent/GB2109205B/en
Priority to DE3233637A priority patent/DE3233637C2/de
Publication of JPS5876899A publication Critical patent/JPS5876899A/ja
Publication of JPH0222398B2 publication Critical patent/JPH0222398B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

【発明の詳細な説明】 本発明は弧立発声された単語音声の音声区間を
効果的に検出し得る音声区間検出装置に関する。
弧立発生された単語音声をパターンマツチング
等によつて認識する場合、その音声区間を正確に
検出することが重要である。一般に音声がエネル
ギーのS/Nにして30dB以上の比較的静かな環
境で発生される場合、これを広帯域マイクロホン
を介して入力することにより、そのパワーや零交
差数が所定の閾値を越える区間を調べることによ
つて比較的簡易にその音声区間を検出することが
できる。また会話形の音声認識システムにあつて
は、デイスプレイ表示や音声出力等によつて発声
者に発声促進を行わしめることによつて音声区間
を検出することができる。つまり、この場合には
発声前の無音区間のパワーや零交差数の平均値、
更にその分散等を求めて背景雑音レベルに適合し
た閾値を設定した上で音声入力を得ることが可能
となるので、その音声区間検出を容易に行うこと
ができる。
ところが、周囲の雑音レベルが高いときや、そ
の雑音レベルが変動する場合には、如何に前処理
によつて閾値を定めたとしても正確な音声区間の
検出が困難である。即ち、閾値を低めに設定した
場合には閾値を越える雑音が頻出し、所謂付加誤
りが増加する。逆に閾値を高めに設定した場合、
その閾値より低い音声成分が欠けて所謂脱落誤り
が増加すると云う問題が生じる。しかも、無音区
間が保証されている場合には、上述したように背
景雑音レベルに応じて閾値を可変することができ
るが、一般に上記無音区間が必ずしも保証されて
いるとは云えない。この為、閾値を設定して音声
入力の音声区間を正確に検出することが非常に困
難であつた。
本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、背景雑音と音声
信号とのS/Nが悪く、しかも背景雑音のレベル
や性質が大きく変動する環境下で発声された音声
の音声区間を正確に検出することのできる簡易で
実用性の高い音声区間検出装置を提供することに
ある。
本発明の概要は、音声信号の音声パラメータ時
系列から音声区間と無音区間とが含まれる区間を
抽出し、その区間における上記音声パラメータの
頻度分布から上記無音区間の音声パラメータの平
均値を求め、その平均値に従つて閾値を設定する
ことによつて上述した目的を効果的に達成したも
のである。
先ず本発明の基本的な考え方につき説明する。
音声信号の音声区間を検出する場合、上記音声
信号の音声パラメータ時系列が用いられる。この
音声パラメータ時系列のグラフ化されたデータを
人間が見た場合、かなり正確に上記音声区間を検
出することができる。これは人間がその思考過程
において、音声パラメータ値を音声のクラスに属
するものかあるいは無音のクラスに属するものか
に分け、これから音声区間を検出するに最適な閾
値を決める。その後、この閾値を用いて各時点の
音声パラメータ値が音声区間に属するか否かの判
定を行い、更に音声区間に属する音声パラメータ
の時点が適当な長さ以上継続しているか否かを判
定し、これらの情報に従つて音声区間を検出して
いるものと考えられる。このような思考過程を音
声認識処理の音声区間検出処理に組込むことによ
つて、その正確な音声区間検出を可能としたもの
が本発明に係る音声区間検出装置である。
以下、図面を参照して本発明の一実施例につき
説明する。尚、ここでは音声信号より抽出され
る、音声パラメータとして、その短時間エネルギ
ーEを考えることにするが、勿論他の要素をパラ
メータとすることも可能である。
第1図は実施例装置の概略構成を示す図で、第
2図a,bおよび第3図はその作用を説明する為
の図である。
第1図において、広帯域マイクロホンから入力
増幅器を介して入力された音声信号は音声パラメ
ータ抽出部1に導びかれる。この音声パラメータ
抽出部1は上記音声信号のエネルギーを、例えば
10msec程度の短時間τ毎に求め、その平均値を
音声パラメータとして一定周期で出力するもので
ある。そして、このようにして求められた前記音
声信号の音声パラメータ時系列は所定時間幅に亘
つて一旦バツフアメモリ2に記憶される。第2図
aはこのようにしてバツフアメモリ2に記憶され
る音声パラメータの時系列を示している。またこ
の第2図aに示す音声信号は、比較的背景難音レ
ベルが高い場合を示している。
しかして、バツフアメモリ2に記憶された音声
パラメータは移動平均計算部3に導びかれてその
移動平均パラメータ値が第2図bに示すように求
められる。この音声信号の移動平均パラメータ値
の時系列が第1段目の音声区間検出部4に導びか
れる。この音声区間検出部4では、第2図bに示
すように、入力された音声パラメータEの移動平
均時系列の値が、所定の閾値E1を越えるか否か
をその先頭から順次判定し、上記移動平均値が始
めて閾値E1を越える時点a1と、この時点a1以後上
記移動平均値が始めて閾値E1を下回る時点b1をそ
れぞれ検出している。その時点a1から時点b1に至
る範囲は音声区間として信頼性の高いものであ
り、これによつて上記時点a1は音声信号の仮始端
として、また時点b1は音声区間の仮終端としてそ
れぞれ検出される。
ところで、このような仮始端と仮終端の検出に
おける前記音声パラメータの移動平均処理は次の
ような意味をもつ。短時間エネルギーは音声区間
と無音区間とを判別する為の、比較的有効なパラ
メータであることは良く知られている。然し乍
ら、背景雑音レベルが比較的高い環境下において
入力される音声信号には、瞬間的に大きなエネル
ギーを持つたパルス性の雑音が混入する虞れが多
分にある。この為、音声パラメータの短時間エネ
ルギーEをそのまま用いて仮始端および仮終端の
検出を行つた場合、上記パルス性の雑音を音声区
間に取込んでしまうと云う不具合が起る。そこ
で、上記したように短時間エネルギーの移動平均
を求めることによつて上述したパルス性の雑音を
ならすことにより、第2図bに示すようにその特
徴を示すパラメータ成分を得ることができる。従
つて、このように処理した移動平均値を用いるこ
とにより、パルス性雑音に左右されることなく安
定に音声信号の存在区間を検出することが可能と
なる。しかるのち、上記検出された仮始端a1と仮
終端b1によつて定まる音声区間において、短時間
エネルギーEの移動平均値のレベルが最も高い時
点Mを音声信号が存在する最も信頼性の高い時点
として検出する。
しかして、上述の如く第1段目の音声区間検出
部4で求められた仮始端a1および仮終端b1の情報
は、頻度分布計数部5に与えられる。この頻度分
布計数部5では、仮始端a1の前位置に相当する所
定時間幅Nuの無音区間の始点a2と、前記仮終端
b1の後位置に相当する所定時間幅Nuの無音区間
の終点b2とを定め、始点a2から終点b2に至る区間
を頻度分布計数区間Nsとして定めている。つま
り、前記a1,b1で定められる音声区間を挾む前後
の所定時間幅Nuの無音区間を含む領域を頻度分
布計算区間としている。そして、この計算区間の
音声パラメータを前記バツフアメモリ2より読出
してそのヒストグラムを第3図のように求め、頻
度分布を求めている。尚、上記所定時間幅Nuは、
大略100〜200msec程度に定められる。しかして
閾値計算部6では、頻度分布計数部5によつて求
められたヒストグラムに従つて、或る短時間エネ
ルギーの値ETHを閾値として、短時間エネルギー
Eの分布を2つのクラスに分けている。そして、
エネルギーEが上記閾値ETHより低いクラスを無
音クラス、また閾値ETHより高いクラスを音声ク
ラスとして定めている。そして、この2つのクラ
ス間の級間分散σBを計算し、この級間分散σBが最
大となるべく、最適な閾値ETHOを求めている。こ
の閾値ETHOに従つて閾値計算部6はE<ETHOなる
無音クラスの頻度分布から無音区間の短時間エネ
ルギーEの平均値を求め、更にこの平均値に短時
間エネルギーEの所謂ばらつきを考慮した上で所
定の値を加え、これを音声区間検出の正規の閾値
EOPとして出力している。
尚、無音クラスと音声クラスを区分する最適閾
値ETHOを求めるに際し、閾値ETHを短時間エネル
ギーEの最小値から最大値まで変化させて、その
全てにおける級間分散σBを求め、級間分散σBが最
大となる閾値ETHを検出して最適閾値ETHOを決定
するようにしてもよい。しかしこのように処理す
ることは複雑である上、実際には級間分散σBが単
峰性を有することから、これを利用して級間分散
σBの極大値を検出したとき、これを最大値と看做
して最適閾値ETHOを決定するようにしてもよい。
しかして、第2段目の音声区間検出部7には閾
値計算部6で求められた閾値EOPおよび前記第1
段目の音声区間検出部4で求められた時点Mの情
報をそれぞれ入力している。そして、これら情報
EOP、Mに従つて前記バツフアメモリ2から読出
した音声パラメータを処理して、その音声区間の
始端aと終端bとをそれぞれ求めている。
この音声区間検出部7における音声区間の始点
aおよび終点bの検出アルゴリズムは次の通りで
ある。即ち始端aの検出は、中心時点Mより短時
間エネルギーEの時系列を逆に辿り、その値が閾
値EOPを下廻る時点を検出する。つまりE<EOP
る時点を検出する。そして、E<EOPとなる最初
の時点をとし、この時点より前方にE<EOP
なる区間が所定の時間幅N1だけ継続するか否か
を調べる。上記時間幅N1は、例えば200〜
250msec程度である。そして、上記時間幅N1
条件が満たされたとき、上記時点を始点aとし
て検出する。尚、上記最初のE<EOP点検出後、
時間幅N1なる無音区間が検出されないとき、そ
の間にE>EOPとなる区間が所定時間幅N2に満た
ない場合には、これをパルス性の雑音によるもの
だと看做し、無音区間として判定する。従つてこ
の場合には、先の時点に逆上つて始端aが決定
されることになる。
またE>EOPなる区間が所定時間幅N2以上継続
した場合には単語中の別の音声区間であると看做
して、次のE<EOPとなる時点を改めてと設定
し、同様に無音区間(時間幅N1)の検出を行い、
これを順次繰返して始端aを決定する。
一方、終端も同様なアルゴリズによつて検出さ
れるが、この場合中心時点Mから時系列方向(時
間方向)に短時間エネルギーEを検出して行われ
る。
以上のようにして音声区間検出部7により入力
音声の音声パラメータ時系列から、その音声区間
を示す始端aと終端bとがそれぞれ正確に検出さ
れることになる。従つて、背景雑音レベルが高い
場合であつても、またそのレベルが変動する環境
下にあつても簡易にして正確に音声区間の検出を
行うことができる。しかも第1図に示したように
装置構成は簡単であり、また安定動作が期待でき
る。従つて実用的利点は絶大である。また始点a
および終点bの検出アルゴリズムも簡単であり、
信頼性の高い高精度な検出が可能となる。
尚、本発明は上記実施例に限定されるものでは
ない。例えば音声パラメータとして、LPC分析
による予測誤差や、音声信号の相関係数等を用い
ることができる。また頻度計算のアルゴリズム等
も種々変形できる。要するに本発明はその要旨を
逸脱しない範囲で種々変形して実施することがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す音声区間検出
装置の概略構成図、第2図a,bおよび第3図は
実施例装置の作用を説明する為の音声パラメータ
とその移動平均とヒストグラムをそれぞれ示す図
である。 1…音声パラメータ抽出部、2…バツフアメモ
リ、3…移動平均計算部、4…音声区間検出部、
5…頻度分布計数部、6…閾値計算部、7…音声
区間検出部。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声からその音声パラメータ時系列を抽
    出する手段と、その音声パラメータ時系列を記憶
    するメモリと、上記音声パラメータ時系列から音
    声区間の仮始端と仮終端とをそれぞれ抽出する手
    段と、上記仮始端と仮終端とによつて定められる
    音声区間およびこの音声区間を挟む前後の所定時
    間幅の無音区間の音声パラメータを前記メモリか
    ら抽出してこれらの抽出された音声パラメータの
    頻度分布を求める手段と、この頻度分布の従つて
    上記無音区間における音声パラメータの平均値を
    求める手段と、この平均値に従つて前記メモリに
    記憶された音声パラメータに対する閾値を設定し
    て音声区間の始端を検出する手段と、前記平均値
    に従つて前記メモリに記憶された音声パラメータ
    に対する閾値を設定して音声区間の終端を検出す
    る手段とを具備したことを特徴とする音声区間検
    出装置。 2 音声区間の仮始端と仮終端とをそれぞれ検出
    する手段は、メモリに記憶された音声パラメータ
    時系列の移動平均パラメータ値を求め、この移動
    平均パラメータ値が所定の時間幅継続したとき、
    その始点を仮始端とし、且つそり終点を仮終端と
    してそれぞれ検出するものである特許請求の範囲
    第1項に記載の音声区間検出装置。 3 頻度分布から無音区間における音声パラメー
    タの平均値を求める手段は、頻度分布を2つのク
    ラスに分割したときクラス間の級間分散が最大と
    なる値にて頻度分布を2つのクラスに分け、その
    一方を無音区間のものと看做すと共に他方を音声
    区間のものと看做して上記音声区間のクラスの平
    均値を無音区間の音声パラメータの平均値として
    求めるものである特許請求の範囲第1項に記載の
    音声区間検出装置。 4 音声パラメータの平均値に従つて設定される
    閾値は、上記無音区間の音声パラメータの平均値
    に所定の値を加えて設定されるものである特許請
    求の範囲第1項に記載の音声区間検出装置。 5 音声区間の始端を検出する手段は、仮始端か
    ら仮終端の間での移動平均パラメータ値により音
    声区間の中心を検出し、その点から前方に音声パ
    ラメータ値が閾値を下回つているどうかを調べて
    いき、音声パラメータ値が閾値を下回つて所定の
    時間幅継続したとき、その始点を音声区間の始端
    として決定するものである特許請求の範囲第1項
    に記載の音声区間検出装置。 6 音声区間の終端を検出する手段は、仮始端か
    ら仮終端の間での移動平均パラメータ値により音
    声区間の中心を検出し、その点から後方に音声パ
    ラメータ値が閾値を下回つているどうかを調べて
    いき、音声パラメータ値が閾値を下回つて所定の
    時間幅継続したとき、その始点を音声区間の終端
    として決定するものである特許請求の範囲第1項
    に記載の音声区間検出装置。
JP56175431A 1981-10-31 1981-10-31 音声区間検出装置 Granted JPS5876899A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56175431A JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置
US06/412,234 US4535473A (en) 1981-10-31 1982-08-27 Apparatus for detecting the duration of voice
GB08225301A GB2109205B (en) 1981-10-31 1982-09-06 Apparatus for detecting the duration of voice
DE3233637A DE3233637C2 (de) 1981-10-31 1982-09-10 Vorrichtung zur Bestimmung der Dauer von Sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56175431A JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS5876899A JPS5876899A (ja) 1983-05-10
JPH0222398B2 true JPH0222398B2 (ja) 1990-05-18

Family

ID=15995979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56175431A Granted JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置

Country Status (4)

Country Link
US (1) US4535473A (ja)
JP (1) JPS5876899A (ja)
DE (1) DE3233637C2 (ja)
GB (1) GB2109205B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08266747A (ja) * 1995-03-31 1996-10-15 Matsushita Electric Ind Co Ltd 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3243232A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
JPS59139099A (ja) * 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
JPS59182498A (ja) * 1983-04-01 1984-10-17 日本電気株式会社 音声検出回路
EP0143161A1 (en) * 1983-07-08 1985-06-05 International Standard Electric Corporation Apparatus for automatic speech activity detection
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
JPS60254279A (ja) * 1984-05-31 1985-12-14 Fuji Electric Co Ltd 2値化しきい値の決定方法
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
JPS61163400A (ja) * 1985-01-14 1986-07-24 横河電機株式会社 音声分析装置
JP2521425B2 (ja) * 1985-07-24 1996-08-07 松下電器産業株式会社 音声区間検出装置
JPS62296270A (ja) * 1986-06-16 1987-12-23 Toshiba Corp 画像処理装置
FR2629964B1 (fr) * 1988-04-12 1991-03-08 Telediffusion Fse Procede et dispositif de discrimination de signal
JP2885801B2 (ja) * 1988-07-05 1999-04-26 松下電送システム株式会社 変復調装置
US5033087A (en) * 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US5819217A (en) * 1995-12-21 1998-10-06 Nynex Science & Technology, Inc. Method and system for differentiating between speech and noise
KR100207426B1 (ko) * 1996-05-08 1999-07-15 전주범 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
US5884255A (en) * 1996-07-16 1999-03-16 Coherent Communications Systems Corp. Speech detection system employing multiple determinants
US5864793A (en) * 1996-08-06 1999-01-26 Cirrus Logic, Inc. Persistence and dynamic threshold based intermittent signal detector
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6480823B1 (en) * 1998-03-24 2002-11-12 Matsushita Electric Industrial Co., Ltd. Speech detection for noisy conditions
JP4810044B2 (ja) * 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置
US7020448B2 (en) * 2003-03-07 2006-03-28 Conwise Technology Corporation Ltd. Method for detecting a tone signal through digital signal processing
JP4521673B2 (ja) * 2003-06-19 2010-08-11 株式会社国際電気通信基礎技術研究所 発話区間検出装置、コンピュータプログラム及びコンピュータ
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
JP4557919B2 (ja) * 2006-03-29 2010-10-06 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
JP2008158328A (ja) * 2006-12-25 2008-07-10 Ntt Docomo Inc 端末装置及び判別方法
JP4840149B2 (ja) * 2007-01-12 2011-12-21 ヤマハ株式会社 発音期間を特定する音信号処理装置およびプログラム
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) * 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) * 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) * 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
KR20130014895A (ko) * 2011-08-01 2013-02-12 한국전자통신연구원 음원 분리 기준 결정 장치와 방법 및 음원 분리 장치와 방법
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
JP7275711B2 (ja) * 2019-03-20 2023-05-18 ヤマハ株式会社 オーディオ信号の処理方法
CN113270118B (zh) * 2021-05-14 2024-02-13 杭州网易智企科技有限公司 语音活动侦测方法及装置、存储介质和电子设备
JP7013610B1 (ja) 2021-05-17 2022-01-31 株式会社アイセロ 容器及び容器組立体
CN113749620B (zh) * 2021-09-27 2024-03-12 广州医科大学附属第一医院(广州呼吸中心) 一种睡眠呼吸暂停检测方法、系统、设备及存储介质
CN117746905B (zh) * 2024-02-18 2024-04-19 百鸟数据科技(北京)有限责任公司 基于时频持续性分析的人类活动影响评估方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse
FR2437125A1 (fr) * 1978-09-21 1980-04-18 Cit Alcatel Dispositif de traitement d'un signal d'analyse d'image
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08266747A (ja) * 1995-03-31 1996-10-15 Matsushita Electric Ind Co Ltd 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具

Also Published As

Publication number Publication date
GB2109205A (en) 1983-05-25
JPS5876899A (ja) 1983-05-10
US4535473A (en) 1985-08-13
DE3233637A1 (de) 1983-05-19
DE3233637C2 (de) 1986-07-03
GB2109205B (en) 1985-05-09

Similar Documents

Publication Publication Date Title
JPH0222398B2 (ja)
US8428945B2 (en) Acoustic signal classification system
EP0962913B1 (en) Speech recognition
EP0077194B1 (en) Speech recognition system
US8473282B2 (en) Sound processing device and program
JPH0990974A (ja) 信号処理方法
EP0411290A2 (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
JPS62217295A (ja) 音声認識方式
JP5050698B2 (ja) 音声処理装置およびプログラム
JP2797861B2 (ja) 音声検出方法および音声検出装置
Taboada et al. Explicit estimation of speech boundaries
Pal et al. Modified energy based method for word endpoints detection of continuous speech signal in real world environment
US20050114135A1 (en) Signal variation feature based confidence measure
Hakkani-Tur et al. Error prediction in spoken dialog: from signal-to-noise ratio to semantic confidence scores
JP2666296B2 (ja) 音声認識装置
US20220199074A1 (en) A dialog detector
JP2882791B2 (ja) パターン比較方式
JP3049711B2 (ja) 音声処理装置
JP3031081B2 (ja) 音声認識装置
JPH034918B2 (ja)
JPH0376471B2 (ja)
Kartik et al. Speaker change detection using support vector machines
JP2891259B2 (ja) 音声区間検出装置
JP3032215B2 (ja) 有音検出装置及びその方法
Ahmad et al. An isolated speech endpoint detector using multiple speech features