JPS6041099A - 音声区間切り出し方式 - Google Patents

音声区間切り出し方式

Info

Publication number
JPS6041099A
JPS6041099A JP58149382A JP14938283A JPS6041099A JP S6041099 A JPS6041099 A JP S6041099A JP 58149382 A JP58149382 A JP 58149382A JP 14938283 A JP14938283 A JP 14938283A JP S6041099 A JPS6041099 A JP S6041099A
Authority
JP
Japan
Prior art keywords
voice
level
voice section
detection unit
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58149382A
Other languages
English (en)
Inventor
中谷 奉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58149382A priority Critical patent/JPS6041099A/ja
Publication of JPS6041099A publication Critical patent/JPS6041099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 伎1ヒ1万 本発明は、音声信号に混入したノイズに関係なく安定し
て音声区間を切り出し4!4るようにしたj′1声区間
切り出し方式に関する。
更太韮遣 音声認識装置において、入力信−j対雑γ丁比が良好な
音声を対象とする場合には、1″?声の存イ1する区間
を抽出することは比較的容易なことである。
しかしながら、音声認識装置が実際に使用されるような
環境においては、種々の騒音を含み、;?声は騒音と重
畳された形で入力される。このような点を考慮して従来
、音声信号の周波数的特徴に7゜目し、低域強調成分が
あれば有声音区間、高域強調成分があれば無β音区間と
し、てi″f声区間を検出する方法が提案されているか
、騒1′fの種類により安定した音声区rMJの切り出
しは困難であり1.誤認識の一因となっていた。
W−一」 木発りJは、」−述のごとき実情に鑑みてなされたもの
で、特に、周囲定常騒音し″ベルの高低ばかかわりなく
安定した音声区間の切り出しを行い、安定した認識率を
確保することのできる音声区間切り出し方式を提供する
ことを目的としてなされたものである。
え−−1 本発明の構成について、以下、実施例に基づいて説明す
る。
第1図は、本発明の一実施例を説明するための構成図で
、入力端1からの音声入力信号は、比較器2、低域濾波
回路3、及び、高域濾波回路4に並列に入力される。比
較器2の基準電圧入力端子には閾値発生回路5からの閾
値が印加される。低域濾波回路3の出力は比較器7に、
また、高域濾波回路4の出力は比較器9に加えられる。
比較器2の出力はカウンタ回路10を経て論理積回路1
2の一方の入力端子に加えられる。比較器7及び9の出
力は排他的論理和回路11を経て論理積回路12のもう
一方の入力端子に加えられる。論理積回路12の出力信
号は端子13より得られる。
次に、第1図に示した実施例の動作を説明する。先づ、
比較器2、閾値発生回路5、及び、カウンタ回路10か
らなる定レベル交叉数検出器により閾値発生回路5で指
定するレベル(閾値)を入力信号が交叉する交叉数を検
出する。この閾値は通常ノイズレベルより多少大きなレ
ベルを使用する。この交叉数の検出により定常ノイズレ
ベルより大きな音声久方により交叉の数をカウントする
。このカウント数は子音のような無声音区間では多く、
母音のような有声音区間では少な目に現われる。このカ
ウント数で一定量より多い区間を交叉数により音声区間
とする。
次に、低域濾波回路3、比較器7、及び閾値発生回路6
からなる低域成分検出部において、有声音声成分を抽出
するための低域濾波回路出力が通常ノイズレベルより多
ヂ大きな値で代表される閾値と比較され、入力信号が大
きいときに出方信号を発生する。とこでは母音で代表さ
れる有声音声区間が検出Xれる。
同様に、高域濾波回路4、比較器9、及び、閾値発生回
路8からなる高域成分41!/44部において、無声音
声成分を抽出するための高域濾波回路出力が通常ノイズ
レベルより多少大きな値で代表される閾値と比較され、
入力信号が大きいときに出力信号を発生する。ここでは
子音で代表される無声音声区間が検出される。
而して、音声信号は、その構成かも全帯域に亘って同時
に成分が存在することはないので排他的論理和をとるこ
とにより通常ノイズのような全帯域に亘る成分と分離す
ることができる。
また、突発的にノイズレベルが上昇した場合は、定レベ
ル交叉数が上昇し、交叉数のみでは誤検出となるが低域
及び高域成分の検出出力との論理積をとることにより、
この誤検出を防]Eできる。このように、交叉数と帯域
成分の検出結果の論理積をとることにより夫々の単独結
果による誤検出を防IFできる。
第2図は1本発明の他の実施例を承す図で、図中、第1
図と同様の作用をする部分には、第1図の場合と同一の
参照番号が付しである。而して、この実施例が第1図に
示した実施例と異なるところは、第1図の実施例では比
較器の閾値が夫々別々に固定であったのに対し、この実
施例では共通の可変閾値を用いている点である。この可
変閾値は、入力端1からの人力信号のレベルをレベル検
出器14で検出して使用する。このレベル検出は平均的
なエネルギーレベルを検波回路と積分回路により検出す
るものであるが、この積分の時定数は十分に大きな値で
、通常500m5以上の仙を用いる。こうすることによ
り突発的な信号レベルの変化には追従しないが定常的な
ノイズレベル(7)ような値は良く反映する。この実施
例のように可変閾値を用いると、周囲騒音レベルの変化
に追従した信号区間検出ができるようになる。
なお、低域濾波回路と高域濾波回路は音声信号のスペク
トルを抽出する′ために使用するバンドパスフィルター
群の低域及び高域の複数チャンネル出力を利用しても同
様の効果が得られることは訂うまでもない。
侠−−〜呈 以上の説明から明らかなように、本発明番トよるど入力
信号の定レベル交叉数による音声区間の検出と低域及び
高域の信号成分の排他的論理和により1″ff声1を検
出した結果の論理積をとることにj−り夫々単独結果で
の誤検出を防11−シてilEしい音1”区間を検出す
ることができる。
【図面の簡単な説明】
第1図及び第2r)!″lは、それぞれ本発明の詳細な
説明するための構成図である。 1・・・入力端、2,7.9・・・比較器、3・・・低
域濾波回路、4・・・、−1,域濾波回路、5,6.8
・・・閾値発生回路、lO・・・力tンター、11・・
・υ1他曲論理和回路、12・・・論理積回路、13出
力端、14・・・レベル検出器。 手続補正書(岐) 昭和58年lO月11日 1、l]V件の表示 昭和58年 特許願 第149382号2、発明の名称 音声区間切り出し方式 3、補正をする者 11件との関係 特許出願人 オオタク ナカマゴメ 住所 東京都大田区中馬込 1丁目3番6号氏 名(名
称) (674) 株式会社 リコー代表者 浜 1)
 広 4、代 理 人 住 所 〒231 横浜市中区不老町1−2−7明細書
第3頁第14行目に記載の「入力端子に加えられる。」
を[入力端子に加えられる。比較器7及び1]の基準電
圧入力端子には閾値発生回路6及び8からの閾値が印加
される。」に補正する。

Claims (1)

  1. 【特許請求の範囲】 H)、y声認識装置において、入力信号の定レベル交叉
    数を検出する定レベル交叉数検出部と、有声i′1声成
    分成分出する低域成分検出部と、無声音声成分を検出す
    る高域成分検出部とを有し、これら検出部の出力の排他
    的論理和と論理積により音声区間を検出することを特徴
    とする音声区間切り出し方式。 (2)、+iij記検出部の閾値を周囲定常騒音レベル
    より少し市めに固定して設定するごとを特徴とする特1
    :1請求の範囲第(1)ダ1に記載の音声区間切り出し
    方式。 (3)、前記検出部の闇値を入力信号の平均的なエネル
    ギーレベルを検出して信号のレベルに追従して設定する
    ことを特徴とする特許請求の範囲第(1)l工1に記載
    の音声区間切り出し方式。
JP58149382A 1983-08-16 1983-08-16 音声区間切り出し方式 Pending JPS6041099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58149382A JPS6041099A (ja) 1983-08-16 1983-08-16 音声区間切り出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58149382A JPS6041099A (ja) 1983-08-16 1983-08-16 音声区間切り出し方式

Publications (1)

Publication Number Publication Date
JPS6041099A true JPS6041099A (ja) 1985-03-04

Family

ID=15473903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58149382A Pending JPS6041099A (ja) 1983-08-16 1983-08-16 音声区間切り出し方式

Country Status (1)

Country Link
JP (1) JPS6041099A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62204300A (ja) * 1986-03-05 1987-09-08 日本無線株式会社 ボイススイツチ
JPS6310199A (ja) * 1986-07-02 1988-01-16 東通電子サ−ビス株式会社 音声スイツチ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62204300A (ja) * 1986-03-05 1987-09-08 日本無線株式会社 ボイススイツチ
JPS6310199A (ja) * 1986-07-02 1988-01-16 東通電子サ−ビス株式会社 音声スイツチ

Similar Documents

Publication Publication Date Title
Chou et al. Robust singing detection in speech/music discriminator design
El-Maleh et al. Speech/music discrimination for multimedia applications
Zhang et al. Heuristic approach for generic audio data segmentation and annotation
KR101269296B1 (ko) 모노포닉 오디오 신호로부터 오디오 소스를 분리하는 뉴럴네트워크 분류기
US20040064209A1 (en) System and method for generating an audio thumbnail of an audio track
JP2004528599A (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
Denbigh et al. Pitch extraction and separation of overlapping speech
JPS6041099A (ja) 音声区間切り出し方式
JP2992324B2 (ja) 音声区間検出方法
Kos et al. On-line speech/music segmentation for broadcast news domain
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH0383100A (ja) 音声区間の検出装置
JP2968976B2 (ja) 音声認識装置
Thoshkahna et al. A psychoacoustics based sound onset detection algorithm for polyphonic audio
Lin et al. A new approach for classification of generic audio data
JP2557497B2 (ja) 男女声の識別方法
Kim et al. A real time singing voice removal system using DSP and multichannel audio interface
JPS63163495A (ja) 音声区間検出装置
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法
JP3423233B2 (ja) オーディオ信号処理方法および装置
Heckmann et al. Sound source separation for a robot based on pitch
JPH0117160B2 (ja)
JPS59228300A (ja) 音声区間検出方式
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS61292699A (ja) 音声通過フイルタ