JP2959791B2 - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JP2959791B2
JP2959791B2 JP3321090A JP3321090A JP2959791B2 JP 2959791 B2 JP2959791 B2 JP 2959791B2 JP 3321090 A JP3321090 A JP 3321090A JP 3321090 A JP3321090 A JP 3321090A JP 2959791 B2 JP2959791 B2 JP 2959791B2
Authority
JP
Japan
Prior art keywords
cepstrum
vowel
consonant
peak
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3321090A
Other languages
English (en)
Other versions
JPH03235999A (ja
Inventor
明 野原
丈二 加根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3321090A priority Critical patent/JP2959791B2/ja
Priority to US07/637,271 priority patent/US5204906A/en
Priority to AU69278/91A priority patent/AU635600B2/en
Priority to EP91101452A priority patent/EP0442342B1/en
Priority to DE69105154T priority patent/DE69105154T2/de
Priority to NO910535A priority patent/NO306360B1/no
Priority to CA002036199A priority patent/CA2036199C/en
Priority to FI910679A priority patent/FI103930B1/fi
Priority to KR1019910002431A priority patent/KR960005740B1/ko
Publication of JPH03235999A publication Critical patent/JPH03235999A/ja
Priority to HK185195A priority patent/HK185195A/xx
Application granted granted Critical
Publication of JP2959791B2 publication Critical patent/JP2959791B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声信号の母音/子音を判定することがで
きる音声信号処理装置に関するものである。
従来の技術 第4図は、従来の音声信号処理装置のブロック図であ
る。15は信号のフーリエ変換を行うFFT(fast Fuourier
transformation)部、16はケプストラム分析を行うケ
プストラム分析部、17はケプストラムピークを検出する
ピーク検出手段である。即ち、FFT部15は入力信号を高
速フーリエ変換し、ケプストラム分析部16へ供給する。
ケプストラム分析部16は、高速フーリエ変換された結果
よりケプストラム信号を求め、ピーク部17へ供給する。
ピーク検出部17は、ケプストラム分析部16で得られるケ
プストラム信号のピークを検出した時に信号を出力する
ように構成されている。
以上のように構成された従来の信号処理装置の動作
を、以下に説明する。
音声信号入力は、FFT部15で高速フーリエ変換され、
次にケプストラム分析部16でケプストラムが求められ
る。そしてピーク検出部17でケプストラムのピークが求
められ、ピークが存在する場合に音声信号を検出したこ
とを示す信号が出力される。
発明が解決しようとする課題 しかしながら、従来の音声信号処理装置によれば、ケ
プストラムのピークのみを検出することで音声検出を行
っているので、母音に対しては有効であるが、子音に対
しては雑音と区別し難く、音声の検出を正確に行うこと
ができないという課題がある。
本発明は、このような従来の音声信号処理装置の課題
を解決するもので、子音も確実に検出できる音声信号処
理装置を提供することを目的とする。
課題を解決するための手段 請求項1記載の発明は、ケプストラム抽出手段、ピー
ク検出手段、平均値算出手段、母音/子音判定手段を備
える音声信号処理装置であって、ケプストラム抽出手段
は入力音声信号からケプストラムを算出し、ピーク検出
手段はケプストラムのピーク情報を検出し、平均値算出
手段はケプストラムの平均値情報を検出し、母音/子音
判定手段はピーク情報に基づいて母音を、平均値情報に
基づいて子音を判定する音声信号処理装置である。
請求項2記載の発明は、請求項1において、母音/子
音判定手段は、第1シュレスホールド設定部、第1比較
器、第2シュレスホールド設定部、第2比較器、母音/
子音判定回路を備え、第1シュレスホールド設定部に
は、平均値情報に基づいて第1シュレスホールド値が設
定され、第1比較器は、第1シュレスホールド値とピー
ク情報を比較して第1比較結果を出力し、第2シュレス
ホールド設定部には、所定の第2のシュレスホールド値
が設定され、第2比較器は、第2シュレスホールド値と
平均値情報を比較して第2比較結果を出力し、母音/子
音判定回路は、第1比較結果に基づいて母音を、第2比
較結果に基づいて子音を判定する音声信号処理装置であ
る。
作用 本発明は、例えばFFT手段で高速フーリエ変換され、
次にケプストラム分析手段でそのケプストラムが求めら
れ、そのケプストラムはピーク検出手段と平均値算出手
段とにそれぞれ供給される。ピーク検出手段では、供給
されるケプストラム信号のピークを検出し、母音/子音
判定手段に供給する。また、平均値算出手段では供給さ
れるケプストラムの平均値を求め、母音/子音判定手段
に供給する。そして母音/子音判定手段は、与えられた
ケプストラムのピーク信号とケプストラムの平均値とを
用いて、ケプストラムのピークが存在する場合には音声
信号入力は母音であると判定し、また、例えばケプスト
ラムの平均値が大きい場合、或は増大する場合等には子
音であると判定し、判定出力を出力する。
実施例 以下に、本発明の実施例を、その図面に基づいて説明
する。
第1図は、本発明の一実施例における音声信号処理装
置のブロック図である。第1図において、1は、信号を
周波数分析する周波数分析手段の一例としての、信号を
フーリエ変換するFFT手段、2は、ピッチ抽出分析手段
の一例としての、ケプストラム分析を行うケプストラム
分析手段、3はケプストラム分布のピークを検出するピ
ッチ検出手段の一例としてのピーク検出手段、4はケプ
ストラム分布の平均値算出手段、5は母音と子音を判定
する母音/子音判定手段である。
即ち、FFT手段1は音声信号入力を高速フーリエ変換
し、ケプストラム分析手段2へ供給する。ケプストラム
分析手段2は、そのスペクトラム信号についてのケプス
トラムを求め、ピーク検出手段3及び平均値算出手段4
へ供給する。第2図(a)、(b)にそれを示す。ピー
ク検出手段3は、ケプストラム分析手段2で得られたケ
プストラムについて、そのピークを求め、母音/子音判
定手段5に供給する。
他方、平均値算出手段4は、ケプストラム分析手段2
で得られるケプストラムの平均値を算出し、母音/子音
判定手段5に供給する。母音/子音判定手段5は、ピー
ク検出手段3から供給されるケプストラムのピークと平
均値算出手段4から供給されるケプストラムの平均値を
用いて音声信号入力の母音及び子音を判定し、判定結果
を判定出力とするものである。
以上のように構成された本発明の一実施例における音
声処理装置について、以下その動作を説明する。
音声信号入力はFFT手段1で高速フーリエ変換され、
次にケプストラム分析手段2でそのケプストラムが求め
られ、ピーク検出手段3でケプストラムのピークが求め
られ、そのピークのケフレンシーにより、当業者ならピ
ッチを検出できる。また、平均値算出手段4でケプスト
ラムの平均値が求められる。そして母音/子音判定手段
5では、ピーク検出手段3からピークが検出されたこと
を示す信号が入力された場合には、そ音声信号入力は母
音区間であると判断する。また、子音の判定について
は、例えば平均値算出手段4より入力されるケプストラ
ム平均値が予め決められた規定値より大きな場合、或は
そのケプストラム平均値の増加量(微分係数)が予め決
められた規定値より大きな場合は、音声信号入力は子音
区間であると判定する。そして結果としては、母音/子
音を示す信号、或は母音と子音を含んだ音声区間を示す
信号を出力する。
以上のように、本発明によれば、音声信号入力の母音
と子音を判定することで音声の検出を正確に行うことが
可能となる。
次に、別の本発明に付いて説明する。
第3図は、その一実施例を示すブロック図である。第
1図の実施例の手段と同じ手段には、同じ番号を付して
いる。すなわち、1は音声信号を高速フーリエ変換する
FFT手段、2はそのフーリエ変換されたスペクトラム信
号に付いてケプストラムを求めるケプストラム分析手
段、3はそのケプストラム分析結果に基づいて、ピーク
を求めるピーク検出手段、4はそのケプストラムの平均
値を算出する平均値算出手段である。
母音/子音判定手段5は、次のような手段を有してい
る。
すなわち、第1比較器52は、前記ピーク検出手段3で
得られたピーク情報と、第1シュレスホールド設定部51
で設定された所定の閾値とを比較し、その結果を出力す
る回路である。また、その第1シュレスホールド設定部
51は、前記平均値算出手段4で得られた平均値に応じ
て、閾値を設定する手段である。
また、第2比較器53は、第2シュレスホールド設定部
54で設定された所定の閾値と、前記平均値算出手段4で
得られた平均値とを比較し、その結果を出力する回路で
ある。
また、母音/子音判定回路55は、第1比較器52で得ら
れた比較結果と、第2比較器53で得られた比較結果とに
基づき、入力された音声信号が母音あるか子音であるか
を判定する回路である。
次に、上記実施例の動作に付いて説明する。
FFT手段1は、音声信号を高速フーリエ変換する。ケ
プストラム分析手段2は、そのフーリエ変換された信号
に付いて、ケプストラムを求める。ピーク検出手段3
は、その求められたケプストラムに付いて、ピークを検
出する。他方、平均値算出手段4は、前記求められたケ
プストラムに付いてその平均値を算出する。
次に、第1シュレスホールド設定手段51は、ピーク検
出手段3で得られたピークが、母音と判断するに足るピ
ークであるかどうかを決める基準となる閾値を設定す
る。その際、平均値算出手段4で得られた平均値を参照
してその閾値を決定する。例えば、平均値が大きい場合
は、閾を高く設定して確実に母音を示すピークを選択で
きるようにするためである。
第1比較器52は、そのシュレスホールド設定手段51に
よって、設定された閾値と、前記ピーク検出手段3で検
出されたピークとを比較し、その比較結果を出力する。
他方、第2シュレスホールド設定手段54は、所定の閾
値を設定する。平均値自体の閾値、あるいは平均値の増
加傾向を示す微分係数の閾値などである。そして、第2
比較器53は、平均値算出手段4で得られた平均値と、第
2シュレスホールド設定手段54で設定された閾値とを比
較して出力する。すなわち、算出平均値と閾値平均値と
を比較し、あるいは、算出平均値の増加値と、閾値微分
係数値とを比較する。
母音/子音判定回路55は、第1比較器52の比較結果と
第2比較器53の比較結果とに基づき、母音、子音を判定
する。第1比較器52の比較結果において、ピークが確実
に検出されているなら、その区域は母音と判定する。ま
た、第2比較器53の比較結果において、平均値が閾値の
平均値を上回ればその区域は子音と判定する。あるい
は、平均値の増加と、閾値の微分係数を比較し、閾値を
上回ればそこを子音と判定する。
尚、母音/子音判定手段5の判定方法として、音声の
母音と子音の区間の性質、例えば音声は子音+母音で構
成される性質を考慮し、子音区間と母音区間が揃った場
合にはじめて最初の子音区間にさかのぼって子音として
の判定出力を出すようにしてもよい。即ち、雑音と子音
との区別をより確実に行うため、平均値によって子音と
判断する場合でも、その後に区間が続かない場合は雑音
と判定するものである。
また、本発明はコンピュータを利用してソフトウェア
的に実現できるが、専用のハード回路を用いても実現可
能である。
発明の効果 以上の説明から明らかなように、本発明は、周波数分
析された信号のピッチを抽出分析するピッチ抽出分析手
段と、その分析出力におけるピッチを検出するピッチ検
出手段と、前記ピッチ抽出分析出力における平均値レベ
ルを算出する平均値算出手段と、前記ピッチ検出手段の
ピッチ検出情報と前記平均値算出手段の平均値情報に基
づいて、前記ピッチに基づき母音を判定し、前記平均値
情報のレベルに基づき子音と判定して、母音と子音とを
判別する母音/子音判定手段とを備えているので、確実
に母音と、子音を判定でき、音声を間違いなく検出する
ことが出来る効果を奏する。
【図面の簡単な説明】
第1図は本発明にかかる音声信号処理装置の一実施例を
示すブロック図、第2図は同実施例におけるケプストラ
ムピークを示すグラフ、第3図は別の本発明にかかる音
声信号処理装置の一実施例を示すブロック図、第4図は
従来の音声信号処理装置を示すブロック図である。 1……周波数分析手段(帯域分割手段、FFT)、2……
ピッチ抽出分析手段(ケプストラム分析手段)、3……
ピッチ検出手段(ピーク検出手段)、4……平均値算出
手段、5……母音/子音判定手段、51……第1シュレス
ホールド設定部、52……第1比較器、53……第2比較
器、54……第2シュレスホールド設定部、55……母音/
子音判定回路。
フロントページの続き (56)参考文献 特開 平3−220600(JP,A) 特開 平3−212695(JP,A) 特開 昭58−211793(JP,A) 特開 昭61−278000(JP,A) 特開 昭62−17800(JP,A) 特開 昭61−48898(JP,A) 特公 昭63−10437(JP,B2) (58)調査した分野(Int.Cl.6,DB名) G10L 9/00 G10L 9/16 301

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】ケプストラム抽出手段(1、2)、ピーク
    検出手段(3)、平均値算出手段(4)、母音/子音判
    定手段(5)を備える音声信号処理装置であって、 ケプストラム抽出手段(1、2)は、入力音声信号から
    ケプストラムを算出し、 ピーク検出手段(3)は、ケプストラムのピーク情報を
    検出し、 平均値算出手段(4)は、ケプストラムの平均値情報を
    検出し、 母音/子音判定手段(5)は、ピーク情報に基づいて母
    音を、平均値情報に基づいて子音を判定することを特徴
    とする、 音声信号処理装置。
  2. 【請求項2】前記母音/子音判定手段(5)は、第1シ
    ュレスホールド設定部(51)、第1比較器(55)、第2
    シュレスホールド設定部(54)、第2比較器(53)、母
    音/子音判定回路(55)を備え、 前記第1シュレスホールド設定部(51)には、平均値情
    報に基づいて第1シュレスホールド値が設定され、 前記第1比較器(55)は、第1シュレスホールド値とピ
    ーク情報を比較して第1比較結果を出力し、 前記第2シュレスホールド設定部(54)には、所定の第
    2のシュレスホールド値が設定され、 前記第2比較器(53)は、第2シュレスホールド値と平
    均値情報を比較して第2比較結果を出力し、 前記母音/子音判定回路(55)は、第1比較結果に基づ
    いて母音を、第2比較結果に基づいて子音を判定するこ
    とを特徴とする、 請求項1に記載の音声信号処理装置。
JP3321090A 1990-02-13 1990-02-13 音声信号処理装置 Expired - Fee Related JP2959791B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP3321090A JP2959791B2 (ja) 1990-02-13 1990-02-13 音声信号処理装置
US07/637,271 US5204906A (en) 1990-02-13 1991-01-03 Voice signal processing device
AU69278/91A AU635600B2 (en) 1990-02-13 1991-01-11 Voice signal processing device
EP91101452A EP0442342B1 (en) 1990-02-13 1991-02-04 Voice signal processing device
DE69105154T DE69105154T2 (de) 1990-02-13 1991-02-04 Sprachsignalverarbeitungsvorrichtung.
NO910535A NO306360B1 (no) 1990-02-13 1991-02-11 Anordning og fremgangsmÕte for talesignal-behandling
CA002036199A CA2036199C (en) 1990-02-13 1991-02-12 Voice signal processing device
FI910679A FI103930B1 (fi) 1990-02-13 1991-02-12 Äänisignaalin käsittelylaite ja -menetelmä
KR1019910002431A KR960005740B1 (ko) 1990-02-13 1991-02-13 음성신호처리장치
HK185195A HK185195A (en) 1990-02-13 1995-12-07 Voice signal processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3321090A JP2959791B2 (ja) 1990-02-13 1990-02-13 音声信号処理装置

Publications (2)

Publication Number Publication Date
JPH03235999A JPH03235999A (ja) 1991-10-21
JP2959791B2 true JP2959791B2 (ja) 1999-10-06

Family

ID=12380092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3321090A Expired - Fee Related JP2959791B2 (ja) 1990-02-13 1990-02-13 音声信号処理装置

Country Status (1)

Country Link
JP (1) JP2959791B2 (ja)

Also Published As

Publication number Publication date
JPH03235999A (ja) 1991-10-21

Similar Documents

Publication Publication Date Title
US7328149B2 (en) Audio segmentation and classification
US20140180682A1 (en) Noise detection device, noise detection method, and program
JPH0713584A (ja) 音声検出装置
EP1901285A2 (en) Voice Authentication Apparatus
US5204906A (en) Voice signal processing device
CN111739542A (zh) 一种特征声音检测的方法、装置及设备
EP2328143B1 (en) Human voice distinguishing method and device
JP2959791B2 (ja) 音声信号処理装置
US6272460B1 (en) Method for implementing a speech verification system for use in a noisy environment
JP3135937B2 (ja) 雑音除去装置
JP6750469B2 (ja) 音声区間検出方法、音声区間検出装置および音声区間検出プログラム
JP2000163099A (ja) 雑音除去装置、音声認識装置および記憶媒体
EP0348888B1 (en) Overflow speech detecting apparatus
CN113257276B (zh) 一种音频场景检测方法、装置、设备及存储介质
WO2022070234A1 (ja) 信号処理装置、信号処理方法、及びコンピュータ読み取り可能な記憶媒体
JP2532618B2 (ja) ピッチ抽出装置
JPH06110492A (ja) 音声認識装置
JP3423233B2 (ja) オーディオ信号処理方法および装置
JP2004109742A (ja) 調波構造区間推定方法及び装置、調波構造区間推定プログラム及びそのプログラムを記録した記録媒体、調波構造区間推定の閾値決定方法及び装置、調波構造区間推定の閾値決定プログラム及びそのプログラムを記録した記録媒体
JPH07101354B2 (ja) 音声区間検出装置
JPH07225592A (ja) 有音区間検出装置
KR970060044A (ko) 유색 잡음 환경에서 주파수 영역의 정보를 이용한 끝점 검출 방법
JP2608702B2 (ja) 音声認識における音声区間検出方法
JP3033537B2 (ja) 音声検出器
JP2020173313A (ja) 問題検出装置、問題検出方法および問題検出プログラム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees