JPS5876899A - 音声区間検出装置 - Google Patents

音声区間検出装置

Info

Publication number
JPS5876899A
JPS5876899A JP56175431A JP17543181A JPS5876899A JP S5876899 A JPS5876899 A JP S5876899A JP 56175431 A JP56175431 A JP 56175431A JP 17543181 A JP17543181 A JP 17543181A JP S5876899 A JPS5876899 A JP S5876899A
Authority
JP
Japan
Prior art keywords
voice
section
value
audio
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56175431A
Other languages
English (en)
Other versions
JPH0222398B2 (ja
Inventor
坂田 富生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56175431A priority Critical patent/JPS5876899A/ja
Priority to US06/412,234 priority patent/US4535473A/en
Priority to GB08225301A priority patent/GB2109205B/en
Priority to DE3233637A priority patent/DE3233637C2/de
Publication of JPS5876899A publication Critical patent/JPS5876899A/ja
Publication of JPH0222398B2 publication Critical patent/JPH0222398B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は孤立発声された単語音声の音声区間を効果的に
検出し得る音声区間検出装置に関する。
孤立発生された単語音声をパターンマッチング等によっ
て認識する場合、その音声区間を正確に検出することが
重要である。一般に音声がエネルギーのS/Nにして3
0dB以上の比較的静かな環境で発生される場合、これ
を広帯域マイクロホンを介して入力することにより、そ
のパワーや零交差数が所定の閾値を越える区間を調べる
ことによって比較的簡易にその音声区間を検出すること
ができる。また会話形の音声認識システムにあっては、
ディスプレイ表示や音声出力等によって発声に発声促進
を行わしめることによって音声区間を検出することがで
きる。
つまり、この場合には発声前の無音区間のパワーや零交
差数の平均値、更にその分散等を求めて背景雑音レベル
に適合した閾値を設定した上で音声入力を得ることが可
能となるので、その音声区間検出を容易に行うことがで
きる。
ところが、周囲の雑音レベルが高いときや、その雑音レ
ベルが変動する場合には、如何に前処理によって閾値を
定めたとしても正確な音声区間の検出が困難である。即
ち、閾値を低めに設定した場合には閾値を越える雑音が
頻出し、所謂付加誤りが増加する。逆に閾値を高めに設
定した場合、その閾値より低い音声成分が欠けて所謂脱
落誤りが増加すると云う問題が生じる。
しかも、無音区間が保証されている場合には、上述した
ように背景雑音レベルに応じて閾値を可変することがで
きるが、一般に上記無音区間が必ずしも保証されている
とは云えない。この為、閾値を設定して音声入力の音声
区間を正確に検出することが非常に困難であった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、背景雑音と音声信号とのS/N
が悪く、しかも背景雑音のレベルや性質が大きく変動す
る環境下で発声された音声の音声区間を正確に検出する
ことのできる簡易で実用性の高い音声区間検出装置を提
供することにある。
本発明の概要は、音声信号の音声パラメータ時系列から
音声区間と無音区間とが含まれる区間を抽出し、その区
間における上記音声パラメータの頻度分布から上記無音
区間の音声パラメータの平均値を求め、この平均値に従
って閾値を設定することによって上述した目的を効果的
に達成したものである。
先ず本発明の基本的な考え方につき説明する。
音声信号の音声区間を検出する場合、上記音声信号の音
声パラメータ時系列が用いられる。
この音声パラメータ声系列のグラフ化されたデータを人
間が見た場合、かなり正確に上記音声区間を検出するこ
とができる。これは人間がその思考過程において、音声
パラメータ値を音声のクラスに属するものかあるいは無
音のクラスに属するものかに分け、これから音声区間を
検出するに最適な閾値を決める。その後、この閾値を用
いて各時点の音声パラメータ値が音声区間に属するか否
かの判定を行い、更に音声区間に属する音声パラメータ
の時点が適当な長さ以上継続しているか否かを判定し、
これらの情報に従って音声区間を検出しているものと考
えられる。従って、このような思考過程を音声認識処理
の音声区間検出処理に組込むことによって、その正確な
音声区間検出を可能としたものが本発明に係る音声区間
検出装置である。
以下、図面を参照して本発明の一実施例につき説明する
。尚、ここでは音声信号より抽出される、音声パラメー
タとして、その短時間エネルギーEを考えることにする
が、勿論他の要素をパラメータとすることも可能である
第1図は実施例装置の概略構成を示す図で、第2図(a
)(b)および第3図はその作用を説明する為の図であ
る。
第1図において、広帯域マイクロホンから入力増幅器を
介して入力された音声信号は音声パラメータ抽出部1に
導びかれる。この音声パラメータ抽出部1は上記音声信
号のエネルギーを、例えば10msec程度の短時間τ
毎に求め、その平均値を音声パラメータとして一定周期
で出力するものである。そして、このようにして求めら
れた前記音声信号の音声パラメータ時系列は所定時間幅
に亘って一旦バッファメモリ2に記憶される。第2図(
a)はこのようにしてバッファメモリ2に記憶される音
声パラメータの時系列を示している。またこの第2図(
a)に示す音声信号は、比較的背景雑音レベルが高い場
合を示している。
しかして、バッファメモリ2に記憶された音声パラメー
タは移動平均計算部3に導びかれてその移動平均パラメ
ータ値が第2図(b)に示すように求められる。この音
声信号の移動平均パラメータ値の時系列が第1段目の音
声区間検出部4に導びかれる。この音声区間検出部4で
は、第2図(b)に示すように、入力された音声パラメ
ータEの移動平均時系列の値が、所定の閾値E1を越え
るか否かをその先頭から順次判定し、上記移動平均値が
始めて閾値E1を越える時点a1と、この時点a1以後
上記移動平均値が始めて閾値E1を下回る時点b1をそ
れぞれ検出している。この時点a1から時点b1に至る
範囲は音声区間として信頼性の高いものであり、これに
よって上記時点a1は音声信号の仮始端として、また時
時b1は音声区間の仮終端としてそれぞれ検出される。
ところで、このような仮始端と仮終端の検出における前
記音声パラメータの移動平均処理は次のような意味をも
つ。短時間エネルギーは音声区間と無音区間とを判別す
る為の、比較的有効なパラメータであることは良く知ら
れている。
然し乍ら、背景雑音レベルが比較的高い環境下において
入力される音声信号には、瞬時的に大きなエネルギーを
持ったパルス性の雑音が混入する虞れが多分にある。こ
の為、音声パラメータの短時間エネルギーEをそのまま
用いて仮始端および仮終端の検出を行った場合、上記パ
ルス性の雑音を音声区間に取込んでしまうと云う不具合
が起る。そこで、上記したように短時間エネルギーの移
動平均を求めることによって上述したパルス性の雑音を
ならすことにより、第2図(b)に示すようにその特徴
を示すパラメータ成分を得ることができる。従って、こ
のように処理した移動平均値を用いることにより、パル
ス性雑音に左右されることなく安定に音声信号の存在区
間を検出することが可能となる。しかるのち、上記検出
され九仮始端a1と仮終端b1によって定まる音声区間
において、短時間エネルギーEの移動平均値のレベルが
最も高い時点Mを音声信号が存在する最も信頼性の高い
時点として検出する。
しかして、上述の如く第1段目の音声区間検出部4で求
められた仮始端a1および仮終端b1め情報は、頻度分
布計数部5に与えられる。この頻度分布計数部5では、
仮始端a1の前位置に相当する所定時間幅Nuの無音区
間の始点a2と、前記仮終端b1の後位置に相当する所
定時間幅Nuの無音区間の終点b2とを定め、始点a2
から終点b2に至る区間を頻度分布計数区間Naとして
定めている。つまり、前記a1,b1で定められる音声
区間を挾む前後の所定時間幅Nuの無音区間を含む領域
を頻度分布計算区間としている。そして、こO計算区間
の音声パラメータを前記パッファメモリ2より読出して
そのヒストグラムを第3図のように求め、頻度分布を求
めている。尚、上記所定時間幅Nuは、大略100〜2
00msec程度に定められる。しかして閾値計算部6
では、頻度分布計数部5によって求められたヒストグラ
ムに従って、或る短時間エネルギーの値ETHを閾値と
して、短時間エネルギーEの分布を2つのクラスに分け
ている。
そして、エネルギーEが上記閾値ETHより低いクラス
を無音クラス、また閾値ETHより高いクラスを音声ク
ラスとして定めている。そして、この2つのクラス間の
級間分散σBを計算し、この級間分散σBが最大となる
べく、最適な閾値ETHOを求めている。この閾値ET
HOに従って閾値計算部6はE<ETHOなる無音クラ
スの頻度分布から無音区間の短時間エネルギーEの平均
値を求め、更にこの平均値に短時間エネルギーEの所謂
ばらつきを考慮した上で所定の値を加え、゛これを音声
区間検出の正規の閾値EOPとして出力している。
尚、無音クラスと音声クラスを区分する最適閾値ETH
Oを求めるに際し、閾値ETHを短時間エネルギーEの
最小値から最大値まで変化させて、その全てにおける級
間分散σBを求め、級間分散σBが最大となる閾値ET
Hを検出して最適閾値ETHOを決定するようにしても
よい。しかしこのように処理することは複雑である上、
実際には級間分散σBが単峰性を有することから、これ
を利用して級間分散σBの極大値を検出したとき、これ
を最大値と看倣して最適閾値ETHOを決定するように
してもよい。
しかして、第2段目の音声区間検出部1には閾値計算部
6で求められた閾値EOPおよび前記第1段目の音声区
間検出部4で求められた時点Mの情報をそれぞれ入力し
ている。そして、これら情報EOP、Mに従って前記バ
ッファメモリ2から読出した音声パラメータを処理して
、その音声区間の始端aと終端bとをそれぞれ求めてい
る。
この音声区間検出部1における音声区間の始点aおよび
終点bの検出アルゴリズムは次の通りである。即ち始端
aの検出は、中心時点Mより短時間エネルギーEの時系
列を逆に辿り、その値が閾値EOPを下廻る時点を検出
する。つまりE<EOPなる時点を検出する。そして、
E<EOPとなる最初の時点をaとし、この時点aより
前方にE<EOPなる区間が所定の時間幅N1だけ継続
するか否かを調べる。上記時間幅N1は、例えば200
〜250msec程度である。そして、上記時間幅N1
の条件が満たされたとき、上記時点aを始点aとして検
出する。尚、上記最初のE<EOP点検出後、時間幅N
1なる無音区間が検出されないとき、その間にE>EO
Pとなる区間が所定時間幅N2に満たない場合には、こ
れをパルス性の雑音によるものだと看倣し、無音区間と
して判定する。従ってこの場合には、先の時点aに逆上
って始端aが決定されることになる。
またE>EOPなる区間が所定時間幅N3以上継続した
場合には単語中の別の音声区間であると看倣して、次の
E<EOPとなる時点を改めてaと設定し、同様に無音
区間(時間幅N1)の検出を行い、これを順次繰返して
始端aを決定する。
一方、終端も同様なアルゴリズによって検出されるが、
この場合中心時点Mから時系列方向(時間方向)に短時
間エネルギーEを検出して行われる。
以上のようにして音声区間検出部1により入力音声の音
声パラメータ時系列から、その音声区間を示す始端aと
終端bとがそれぞれを確に検出されることになる。従っ
て、背景雑音レベルが高い場合であっても、またそのレ
ベルが変動する環境下にあっても簡易にして正確に音声
区間の検出を行うことができる。しかも第1図に示した
ように装置構成は簡単であり、また安定動作が期待でき
る。従って実用的利点は絶大である。また始点aおよび
終点bの検出アルゴリズムも簡単であり、信頼性の高い
高精度な検出が可能となる。
尚、本発明は上記実施例に限定されるものではない。例
えば音声パラメータとして、LPC分析による予測誤差
や、音声信号の相関係数等を用いることができる。また
頻度計算のアルゴリズム等も種々変形できる。要するに
本発明はその要旨を逸脱しない範囲で種々変形して実施
することかできる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す音声区間検出装置の概
略構成図、第2図(a)(b)および第3図は実施例装
置の作用を説明する為の音声パラメータとその移動平均
とヒストグラムをそれぞれ示す図である。 1・・・音声パラメータ抽出部、2・・・バッファメモ
リ、3・・・移動平均計算部、4・・・音声区間検出部
、5・・・頻度分布計数部、6・・・閾値計算部、7・
・・音声区間検出部。 出願人代理人  弁理士 鈴 江 武 彦第3図 手続補正書 特許庁長噛  島FB4−樹 殿 1、事件の表ボ 特屓帖 暫6−17を今31号 2、発明的λ邦弥 音30問検出震1 3、補IEをする者 慣性との関係 %tr出4吻人 (3゜−r)肇克を瑚電気林弐全昶 4、代理人 う、白@ネ山′ミ 稍殉1い′ 〒、−I!#゛正の内盗 (1)   Q111B*、elr+喚>si〒F4 
+=  ”%p−r、t’%イ鑓。 (亮21fe−発声渚に尭斉イl蓮」ヒ社正13゜(2
)  同1オ6勧、!−3舌T@+=’tk奔バラメ−
2與系“3リヨヒあa te r−i%−、:声ハ0ラ
メータ畔り系号」」 七智テ正J3゜(3)+’i、>
t4I、Itt口t= ’ l *l”+”eAlN*
 +:」’e*a ”e ’ 14<%”+ Z;4L
 I’;」& ’hL3R。

Claims (5)

    【特許請求の範囲】
  1. (1)入力音声からその音声パラメータ時系列を抽出す
    る手段と、この音声パラメータ時系列を記憶するメモリ
    と、上記音声パラメータ時系列から音声区間の仮始端と
    仮終端とをそれぞれ検出する手段と、上記仮始端と仮終
    端とによって定められる音声区間およびこの音声区間を
    挾む前後の所定時間幅の無音区間の音声パラメータを前
    記メモリから抽出してこれらの抽出された音声パラメー
    タの頻度分布を求める手段と、この頻度分布に従って上
    記無音区間における音声パラメータの平均値を求める手
    段と、この平均値に従って前記メモリに記憶された音声
    パラメータに対する閾値を設定して音声区間の始端と終
    端とをそれぞれ検出する手段とを具備したことを特徴と
    する音声区間検出装置。
  2. (2)音声区間の仮始端と仮終端とをそれぞれ検出する
    手段は、メモリに記憶された音声パラメータ時系列の移
    動平均パラメータ値を求め、この移動平均パラメータ値
    が所定の値を越えて所定の時間幅継続したとき、その始
    点を仮始端とし、且つその終点を仮終端としてそれぞれ
    検出するものである特許請求の範囲第1項記載の音声区
    間検出装置。
  3. (3)頻度分布から無音区間における音声パラメータの
    平均値を求める手段は、頻度分布を2つのクラスに分割
    したときクラス間の級間分散が最大となる値にて頻度分
    布を2つのクラスに分け、その一方を無音区間のものと
    看倣すと共に他方を音声区間のものと看倣して上記無音
    区間のクラスの平均値を無音区間の音声パラメータの平
    均値として求めるものである特許請求の範囲第1項記載
    の音声区間検出装置。
  4. (4)音声パラメータの平均値に従って設定される閾値
    は、上記無音区間の音声パラメータの平均値に所定の値
    を加えて設定されるものである特許請求の範囲第1項記
    載の音声区間検出装置。
  5. (5)音声区間の始端(終端)を検出する手段は、仮始
    端から仮終端の間で移動平均パラメータ値により音声区
    間の中心を検出し、その点から前方(後方)に音声パラ
    メータ値が閾値を下まわっているかどうか調べていき、
    音声パラメータ値が、閾値を下まわって所定の時間幅継
    続したとき、その始点を音声区間の始端(終端)として
    それぞれ決定するものである特許請求の範囲第1項記載
    の音声区間検出装置。
JP56175431A 1981-10-31 1981-10-31 音声区間検出装置 Granted JPS5876899A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56175431A JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置
US06/412,234 US4535473A (en) 1981-10-31 1982-08-27 Apparatus for detecting the duration of voice
GB08225301A GB2109205B (en) 1981-10-31 1982-09-06 Apparatus for detecting the duration of voice
DE3233637A DE3233637C2 (de) 1981-10-31 1982-09-10 Vorrichtung zur Bestimmung der Dauer von Sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56175431A JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS5876899A true JPS5876899A (ja) 1983-05-10
JPH0222398B2 JPH0222398B2 (ja) 1990-05-18

Family

ID=15995979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56175431A Granted JPS5876899A (ja) 1981-10-31 1981-10-31 音声区間検出装置

Country Status (4)

Country Link
US (1) US4535473A (ja)
JP (1) JPS5876899A (ja)
DE (1) DE3233637C2 (ja)
GB (1) GB2109205B (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59182498A (ja) * 1983-04-01 1984-10-17 日本電気株式会社 音声検出回路
JPS61163400A (ja) * 1985-01-14 1986-07-24 横河電機株式会社 音声分析装置
JPS6223096A (ja) * 1985-07-24 1987-01-31 松下電器産業株式会社 音声区間検出装置
JPH0216859A (ja) * 1988-07-05 1990-01-19 Matsushita Graphic Commun Syst Inc 変復調装置
JP2005031632A (ja) * 2003-06-19 2005-02-03 Advanced Telecommunication Research Institute International 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ
JP2008158328A (ja) * 2006-12-25 2008-07-10 Ntt Docomo Inc 端末装置及び判別方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
KR20230025526A (ko) 2021-05-17 2023-02-21 가부시키가이샤 아이세로 용기 및 용기 조립체
CN117746905B (zh) * 2024-02-18 2024-04-19 百鸟数据科技(北京)有限责任公司 基于时频持续性分析的人类活动影响评估方法及系统

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3243232A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen
JPS59139099A (ja) * 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
EP0143161A1 (en) * 1983-07-08 1985-06-05 International Standard Electric Corporation Apparatus for automatic speech activity detection
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
JPS60254279A (ja) * 1984-05-31 1985-12-14 Fuji Electric Co Ltd 2値化しきい値の決定方法
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
JPS62296270A (ja) * 1986-06-16 1987-12-23 Toshiba Corp 画像処理装置
FR2629964B1 (fr) * 1988-04-12 1991-03-08 Telediffusion Fse Procede et dispositif de discrimination de signal
US5033087A (en) * 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
JP3337588B2 (ja) * 1995-03-31 2002-10-21 松下電器産業株式会社 音声応答装置
US5819217A (en) * 1995-12-21 1998-10-06 Nynex Science & Technology, Inc. Method and system for differentiating between speech and noise
KR100207426B1 (ko) * 1996-05-08 1999-07-15 전주범 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
US5884255A (en) * 1996-07-16 1999-03-16 Coherent Communications Systems Corp. Speech detection system employing multiple determinants
US5864793A (en) * 1996-08-06 1999-01-26 Cirrus Logic, Inc. Persistence and dynamic threshold based intermittent signal detector
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US6480823B1 (en) * 1998-03-24 2002-11-12 Matsushita Electric Industrial Co., Ltd. Speech detection for noisy conditions
DE60143506D1 (de) * 2000-01-27 2011-01-05 Nuance Comm Austria Gmbh Sprachdetektiongsgerät mit zwei abschaltkriterien
US7020448B2 (en) * 2003-03-07 2006-03-28 Conwise Technology Corporation Ltd. Method for detecting a tone signal through digital signal processing
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
JP4557919B2 (ja) * 2006-03-29 2010-10-06 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) * 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) * 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) * 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
KR20130014895A (ko) * 2011-08-01 2013-02-12 한국전자통신연구원 음원 분리 기준 결정 장치와 방법 및 음원 분리 장치와 방법
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
JP7275711B2 (ja) * 2019-03-20 2023-05-18 ヤマハ株式会社 オーディオ信号の処理方法
CN113270118B (zh) * 2021-05-14 2024-02-13 杭州网易智企科技有限公司 语音活动侦测方法及装置、存储介质和电子设备
CN113749620B (zh) * 2021-09-27 2024-03-12 广州医科大学附属第一医院(广州呼吸中心) 一种睡眠呼吸暂停检测方法、系统、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse
FR2437125A1 (fr) * 1978-09-21 1980-04-18 Cit Alcatel Dispositif de traitement d'un signal d'analyse d'image
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59182498A (ja) * 1983-04-01 1984-10-17 日本電気株式会社 音声検出回路
JPS61163400A (ja) * 1985-01-14 1986-07-24 横河電機株式会社 音声分析装置
JPS6223096A (ja) * 1985-07-24 1987-01-31 松下電器産業株式会社 音声区間検出装置
JPH0216859A (ja) * 1988-07-05 1990-01-19 Matsushita Graphic Commun Syst Inc 変復調装置
JP2005031632A (ja) * 2003-06-19 2005-02-03 Advanced Telecommunication Research Institute International 発話区間検出装置、音声エネルギ正規化装置、コンピュータプログラム及びコンピュータ
JP4521673B2 (ja) * 2003-06-19 2010-08-11 株式会社国際電気通信基礎技術研究所 発話区間検出装置、コンピュータプログラム及びコンピュータ
JP2008158328A (ja) * 2006-12-25 2008-07-10 Ntt Docomo Inc 端末装置及び判別方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
KR20230025526A (ko) 2021-05-17 2023-02-21 가부시키가이샤 아이세로 용기 및 용기 조립체
CN117746905B (zh) * 2024-02-18 2024-04-19 百鸟数据科技(北京)有限责任公司 基于时频持续性分析的人类活动影响评估方法及系统

Also Published As

Publication number Publication date
JPH0222398B2 (ja) 1990-05-18
DE3233637C2 (de) 1986-07-03
GB2109205A (en) 1983-05-25
DE3233637A1 (de) 1983-05-19
GB2109205B (en) 1985-05-09
US4535473A (en) 1985-08-13

Similar Documents

Publication Publication Date Title
JPS5876899A (ja) 音声区間検出装置
NL192701C (nl) Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal.
CN105529028B (zh) 语音解析方法和装置
EP0962913B1 (en) Speech recognition
JPH0990974A (ja) 信号処理方法
EP0411290A2 (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
JPS58143394A (ja) 音声区間の検出・分類方式
CN116665649A (zh) 基于韵律特征的合成语音检测方法
JPS60200300A (ja) 音声の始端・終端検出装置
US20230402030A1 (en) Embedded Dictation Detection
Ghaemmaghami et al. Noise robust voice activity detection using normal probability testing and time-domain histogram analysis
Pal et al. Modified energy based method for word endpoints detection of continuous speech signal in real world environment
JP3031081B2 (ja) 音声認識装置
JPS59121099A (ja) 音声区間検出装置
Hakkani-Tur et al. Error prediction in spoken dialog: from signal-to-noise ratio to semantic confidence scores
JP3058569B2 (ja) 話者照合方法及び装置
JP2557497B2 (ja) 男女声の識別方法
Brezinski Evaluating the Complexity and Robustness of Speech Utterances using Length and Variance Fractal Dimensions
JPS6147999A (ja) 音声認識装置
Hamzah et al. Acoustical analysis of filled pause in Malay spontaneous speech
JP2891259B2 (ja) 音声区間検出装置
JPH0376471B2 (ja)
JP3049711B2 (ja) 音声処理装置
KR101195742B1 (ko) 키워드별 필러 모델을 구비하는 키워드 검출 시스템 및 키워드별 필러 모델 구현 방법
Jurado et al. Speech text-independent segmentation using an improvement method for identification of phoneme boundaries