JPH02132500A - ピッチ抽出装置および遮断周波数最適化装置 - Google Patents

ピッチ抽出装置および遮断周波数最適化装置

Info

Publication number
JPH02132500A
JPH02132500A JP28710288A JP28710288A JPH02132500A JP H02132500 A JPH02132500 A JP H02132500A JP 28710288 A JP28710288 A JP 28710288A JP 28710288 A JP28710288 A JP 28710288A JP H02132500 A JPH02132500 A JP H02132500A
Authority
JP
Japan
Prior art keywords
frequency
low
pass filter
audio signal
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP28710288A
Other languages
English (en)
Inventor
Nobuhide Yamazaki
山崎 信英
Hiroki Uchiyama
博喜 内山
Hiroo Kitagawa
博雄 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP28710288A priority Critical patent/JPH02132500A/ja
Publication of JPH02132500A publication Critical patent/JPH02132500A/ja
Priority to US07/610,317 priority patent/US5121428A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号のピッチ周期もしくは周波数を抽出
するピッチ抽出装置に関する。
〔従来の技術と解決すべき問題点〕
音声認識、話者認識、音声応答などの分野における重要
な技術的課題の一つに、入力信号の音声区間のピッチ周
期もしくは周波数の抽出がある。
従来、この種のピッチ抽出技術としては、自己相関を用
いる方式、ケプストラムを用いる方式、あるいは零交差
数などを用いる方式がある。
しかし、自己相関またはケプスドラムを用いる方式は、
所定時間長の音声サンプル系列を用いて繰返し演算を行
うものであり、その演算に必要なメモリ容量と演算回数
は膨大であるため、簡易なハードウェア構成でしかも実
時間処理によるピッチ抽出の実現は難しい。
零交差数を用いる方式は演算量は少なく処理が簡単であ
るので、小規模なハードウェア構成で実時間のピッチ抽
出が可能であるが、雑音などの影響を受けやすく倍ピッ
チなどの抽出誤差が多い。
また、ピッチ抽出処理の前に、遮断周波数が900Hz
の低域フィルタ(low−pass filter)に
音声信号を通して、音声信号のピッチ周波数以外の高周
波成分を除くことにより、ピッチ抽出精度を高める技術
が、ゾーンディヒ( S ondihi)により報告さ
れている[書籍″スピーチ信号のデジタル処理” (D
igital processing of Spee
ch Signals) .エル・アール・ラビネール
(LR.Rabiner )ほか,プレンティス・ホー
ル( p r6ntice−hall)社,1987年
+ Pp.150  158コ。
この低域フィルタの遮断周波数は、入力音声信号のピッ
チ周波数の付近に定めることが適当である。しかし、入
力音声信号のピッチ周波数は,時々刻々変化するもので
あり、また発声者が男性であるか女性であるかによって
大きく異なることから、最適な遮断周波数を一意に決定
することは宛しい。特に低域フィルタの遮断周波数の影
響を大きく受ける零交差数などを用いるピッチ抽出方式
では、遮断周波数が不適切であると倍ピッチ、半ピッチ
などの抽出誤りが多い。
他方、音声信号を低域フィルタに通すと無声を有声とす
る誤りが増加したり、非線形クリッピングによる処理の
過程での信号レベル変化によりピッチの大きな誤りも増
加するとの観点から低域フィルタを削除したピッチ抽出
方法も報告されている(論文′゛改良した自己相関形ピ
ッチ抽出器とその評価″、高学明ほか、日本音響学会講
演論文集,−3= 1985年3月,pp.1.57−158)。
本発明の目的は、簡単なハードウェア構成で実時間にて
音声信号のピッチ抽出を行うピッチ抽出装置を提供する
ことである。
本発明のもう一つの目的は、音声信号を通す低域フィル
タの遮断周波数を動的に最適化することにより、倍ピッ
チ、半ピッチなどの抽出誤りを減らしたピッチ抽出装置
を提出することにある。
本発明の別の目的は、音声信号の高周波成分をピッチ抽
出処理の前に除去するための低域フィルタの遮断周波数
を動的に最適化するための装置を提供することにある。
〔課題を解決するための手段および作用〕本発明による
ピッチ抽出装置は、音声信号(音声波形)のピッチ周期
もしくは周波数を所定の区間毎に抽出するものであり、
その構成は、低域渡波手段によって高周波成分を除去し
た音声信号(音声波形)を2値化手段による複数の閾値
によってそれぞれ2値化し、各閾値による2値化信号の
特定の方向の遷移点の時間間隔を計測手段によりそれぞ
れ計測し、計測した各時間間隔より推定手段によってピ
ッチ周期もしくは周波数を推定するというものである。
梓通、人の音声のピッチ周期はほゾlo011zから2
50Hzまでの範囲であるから、低域渡波手段の遮断周
波数を例えば300Hz程度に設定すれば、ピッチ周期
範囲より高周波の雑音成分などを排除した音声信号の2
値化信号を得られる。そして、この各閾値による2値化
信号の特定方向の遷移点の時間間隔は,音声信号の本来
の波形をほゾ忠実に反映している。
したがって、例えば、測定されるべき時間間隔の妥当な
範囲は当然決まってくるので、計測された各時間間隔の
中で予め設定した範囲内の値だけを選択し、あるいは計
測された時間間隔の間の差を求め、その差が所定値以下
である時間間隔だけを選択し、その選択した時間間隔の
集合の平均値または最小値をピッチ周期とするというよ
うな推定方法を採用することにより、雑音などによる影
響を受けにく\、倍ピッチの誤抽出などのない高精度の
ピッチ抽出が可能である。
また、膨大なメモリ容量を要する繰返し演算などの処理
を伴わないので、実時間のピッチ抽出が可能であると\
もに、装置のハードウエア構成を簡略化ずることができ
る。
また本発明によれば、低域渡波手段の遮断周波数は可変
とされ、パワー検出手段によって低域濾波手段に通され
る前の音声信号の短時間平均パワーおよび低域渡波手段
に通された後の音声信号の短時間平均パワーが検出され
、この二つの短時間平均パワーの比が一定になるように
制御手段によって低域渡波手段の遮断周波数が制御され
ることにより、遮断周波数はピッチ抽出に最適な周波数
に動的に調整される。
〔実施例〕
以下、図面を用い、本発明の実施例について説明する。
第1図は本発明の一実施例の概略ブロック図である。マ
イクロホンなどから入力した音声信号は、遮断周波数が
300}{z程瓜の低域フィルタ101?より高周波成
分を除去されたのち、複数のコンパレータl O 21
,1 0 22,”’−  1 0 2nに入力し、そ
れぞれ異なった閾値Th1,Th2,・・・,Th.に
よって2値化される。
これらのコンバレータ102の半数のもの(図の上半分
のもの)は信号波形の振幅の正側で働くもので、残りの
半数のもの(図の下半分のもの)は振幅の負側で働くも
のである。正側のコンパレータによる2値化信号は、振
幅が閾値を正方向へ越えたときに“1”となる。負側の
コンパレー夕による2値化信号は、振幅が閾値を負方向
へ越えたときに“1″となる。
各コンパレータ102の出力信号、ずなわち各閾値によ
る2値化信号は、それぞれ同期回路103■,103■
,・・・,103nに入力し、クロック生成回路104
で生成された基準クロックと同期化され、この同期化後
の2値化信号は計数回路1051,105■,・・・,
105nに入力する。各計数回路105は、同期化回路
103から人力ずる2値化信号の“0″からtt I 
I+への遷移点でゼロク?ア後に基準夕ロックの計数を
開始し、その2値化信号がl( O I+から11 1
 ++へ遷移すると計数を停止する。すなわち、同期化
後の各2値化信号の“0″から″1′″への遷移点の時
間間隔を計測している。
各計数回路105の計数値は、判断回路106■,10
6■,・・・,106,を介して推定回路107へ入力
する。各判断回路106では、対応する計数回路105
の計数値が妥当な範囲内であるか否かを判断し、判断結
果を推定回路107へ通知ずる。例えば、人の音声のピ
ッチ周期は大体100■から250Hzであり、基準ク
ロックの周波数を16KHzとすると、妥当な計数値は
64から160の間であるので、その範囲内のn」数値
を妥当と判断することができる。あるいは、計数値間の
差を求め、それらの差が所定の閾値以下の計数値を妥尚
と判断することができる。判断の基準はこれに限らない
が、いずれにしても計数値の妥当な範囲は前もって予想
可能であるので、面倒な演算を行わず容易に妥当性の判
断が可能である。
推定回路107は、判断回路106によって妥当と判断
された計数値を用い、入力音声信号のピッチ周期もしく
は周波数を推定する回路である。
この推定のアルゴリズムは様々のものが可能であるが、
例えば妥当な計数値の集合の平均値あるいは最小値をピ
ッチ周期とする。
第2図に本実施例の信号波形図を示す。(a)は基準ク
ロックの波形、(b)は低域フィルタ101を通過後の
音声信号の波形である。(c)は正側の一つのコンパレ
ータ102による2値化信号の波形、(d)はこの2値
化信号の同期化後の波形である。(e)は負側のコンパ
レータ102によると2値化信号の波形、(f)はその
同期化後の波形である。計数回路105は、(d)の波
形の(ア)から(イ)の区間、あるいは(f)の波形の
(ウ)から(工)の区間の時間を計測することになる。
第3図は本発明の他の実施例のブロック図である。本実
施例は、2値化閾値を入力振幅に適応化させる点だけが
第1図に示した実施例と違う。ずなわち、低域フィルタ
101を通過した音声信号を、半波整流・平滑回路10
8によって正側および負側に別々に整流・可滑化し、音
声信号の正側と負側の実行値をそれぞれ求める。そして
、閾値設定回路109により、正側の実行値を所定数倍
することにより止側用コンパレータ102の閾値を設定
し、負側の実行値を所定数倍することにより負側用コン
パレータ102の閾値を設定する。
このようにして、入力振幅の変動に対するピッチ抽出の
安定性が高められる。
第4図は本発明の別の実施例のブロック図である。本実
施例は、半波整流・平滑回路108によって求められた
正側および負側の実行値が妥当であるか判断するための
実行値検定回路110を設け、正側または負側の実行値
が所定の閾値以下となった時に推定回路107に対し制
御信号によって推定を禁止する。これ以外は第3図の実
施例と同様である。
なお、前記各実施例において、判断回路106を独立し
た回路として設けず、計数回路105のa1数値の妥当
性判断を、推定回路107による推定アルゴリズム中に
包含させてもよい。また、コンパレータ102がその出
力を直接的に基準クロックに同期化できるものであれば
、独立した同期回路103を設ける必要はない。
第5図は本発明の他の実施例を示すブロック図である。
201はコントロール信号E(アナログ信号またはデジ
タル信号)の値によって遮断周波数が可変の低域フィル
タであり、具体的には電圧制御フィルタやクロック可変
のスイッチト・キャパシタ・フィルタなどである。入力
音声信号は、この低域フィルタ201に通されることに
よって高周波成分を除去されてからピッチ抽出回路部2
02に印加される。このピッチ抽出回路部202は、第
1図ないし第4図に示されたピッチ抽出装置の低域フィ
ルタ101を除いた回路部分に対応する。
203は低域フィルタ201の遮断周波数を動的に最適
化する遮断周波数最適化装置であり、外部から入力音声
信号の短時間平均パワー(A)を検出するパワー検出回
路204、低域フィルタ201を通過後の音声信号の短
時間平均パワー(B)を検出するパワー検出回路205
、この二つの短時間平均パワーの比B/Aが目標値Cよ
り小さいときに遮断周波数を上げ、逆に比B/Aが目標
値Cより大きくなったときに遮断Rd波数を下げるよう
なコン1〜ロール信号Eを発生する制御回路206から
構成されている。このようなコントロール信号Eによっ
て低域フィルタ201の遮断周波数が動的に最適化され
る結果、入力音声信号のピッチが刻々と変化しても、ま
た、発声者の違いにより入力音声信号のピッチが大幅に
変動しても、ピッチ抽出回路部202における倍ピッチ
、半ピッチなどの誤抽出が大幅に削除される。
なお、このような遮断周波数の最適化による利益は、ピ
ッチ抽出回路部202を、零交差数、相関関数などを利
用してピッチ抽出を行う構成とした場合にも得られる。
第6図に制御回路206の一例を示す。この例は、演算
回路207によって回標値Cと短時間平均パワー比B/
Aの差Dを計算し、この差Dの信号を積分回路207に
通した信号をコントロール信号Eとする構成である。た
ゾし、コントロール信号Eの値が増加すると低域フィル
タ201の遮断周波数が上昇する場合を想定している。
第7図に制御回路206の他の例を示す,この例は、パ
ワー検出回路204,205によって検出された短時間
平均パワーA,Bを対数回路209,210によって対
数値A’ ,B’に変換し、演算回路211により D’ =A’ −B’ −C’ (c’は対数化された目標値) の演算を行い、このD′のイd号を積分回路212に通
してコントロール信Eを得るものである。すなわち、数
値を対数化することによって、除算を排除して第6図の
例と同様の演算が行われる。
なお,コン1〜ロール信号Eの値が増加すると低域フィ
ルタ201の低域遮断周波数が高くなるものとしている
〔発明の効果〕 以上の説明から明らかなように、本発明によれば、簡単
なハードウェア構成によって、音声信号のピッチ周期も
しくは周波数を実時間にて高精度に抽出することができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図はその
信号波形図、第3図は本発明の他の実施例の概略ブロッ
ク図、第4図は本発明の別の実施例の概略ブロック図、
第5図は本発明のさらに他の実施例の概略ブロック図、
第6図および第7図はそれぞれ遮断周波数最適化装置の
制御回路の別異の例を示すブロック図である。 101・・・低域フィルタ、 102・・・コンパレータ、  103・・・同期回路
,104・・・クロック生成回路、 105・・・計数回路、 106・・・判断回路、10
7・・・推定回路、 108・・・半波整流・平滑回路、 109・・・閾値設定回路、 110・・・実行値検定回路、 1・・・低域フィルタ、 2・・・ピッチ抽出回路部、 3・・・遮断周波数最適化装置、 4,205・・・パワー検出回路、 6・・・制御回路、 207・・・演算回路、8・・・
積分回路、 9,210・・・対数回路、 1・・・演算回路、  212・・・積分回路。

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号の高周波成分を除去するための手段と、
    この手段によって高周波成分が除去された音声信号を2
    以上の閾値によってそれぞれ2値化する手段と、この手
    段により得られる各閾値による2値化信号の特定の方向
    の遷移点の時間間隔を計測する手段と、この手段により
    計測された各時間間隔より音声信号のピッチ周期もしく
    は周波数を推定する手段とを有することを特徴とするピ
    ッチ抽出装置。
  2. (2)高周波成分除去のための手段は遮断周波数が可変
    の低域フィルタであり、さらに前記低域フィルタを通過
    前の音声信号の短時間平均パワーと前記低域フィルタを
    通過後の音声信号の短時間平均パワーとの比を一定とす
    るように前記フィルタの遮断周波数を制御する手段を有
    することを特徴とする請求項(1)記載のピッチ抽出装
    置。
  3. (3)ピッチ抽出処理の前に音声信号の高周波成分を除
    去するための低域フィルタの遮断周波数を動的に最適化
    する装置であって、前記低域フィルタの入力音声信号お
    よび出力音声信号のそれぞれの短時間平均パワーを検出
    する手段と、この手段によって検出された各短時間平均
    パワーの比と予め定められた目標値との差を求める手段
    と、この手段によって求められた差の時間積分により前
    記低域フィルタの遮断周波数のコントロール信号を得る
    手段とからなる遮断周波数最適化装置。
JP28710288A 1988-01-20 1988-11-14 ピッチ抽出装置および遮断周波数最適化装置 Pending JPH02132500A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28710288A JPH02132500A (ja) 1988-07-25 1988-11-14 ピッチ抽出装置および遮断周波数最適化装置
US07/610,317 US5121428A (en) 1988-01-20 1990-11-08 Speaker verification system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP18515688 1988-07-25
JP63-185156 1988-07-25
JP28710288A JPH02132500A (ja) 1988-07-25 1988-11-14 ピッチ抽出装置および遮断周波数最適化装置

Publications (1)

Publication Number Publication Date
JPH02132500A true JPH02132500A (ja) 1990-05-21

Family

ID=26502943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28710288A Pending JPH02132500A (ja) 1988-01-20 1988-11-14 ピッチ抽出装置および遮断周波数最適化装置

Country Status (1)

Country Link
JP (1) JPH02132500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113038341A (zh) * 2016-07-22 2021-06-25 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113038341A (zh) * 2016-07-22 2021-06-25 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路
CN113038341B (zh) * 2016-07-22 2022-12-02 美商楼氏电子有限公司 电容式传感器组件及其操作方法、集成电路

Similar Documents

Publication Publication Date Title
JP2948739B2 (ja) カラオケシステムの使用者の歌点数採点装置
US9454976B2 (en) Efficient discrimination of voiced and unvoiced sounds
CN105957538B (zh) 基于显著性的复调音乐主旋律提取方法
US9646592B2 (en) Audio signal analysis
CN109712600B (zh) 一种节拍识别的方法及装置
WO2006132599A1 (en) Segmenting a humming signal into musical notes
JP4790318B2 (ja) 2つの調波信号の共通源の判定方法
Li et al. Speech endpoint detection method based on TEO in noisy environment
JP2005292207A (ja) 音楽分析の方法
JPH02132500A (ja) ピッチ抽出装置および遮断周波数最適化装置
CN1971707B (zh) 一种进行基音周期估计和清浊判决的方法及装置
JPH08221097A (ja) 音声成分の検出法
RU2436173C1 (ru) Способ обнаружения пауз в речевых сигналах и устройство его реализующее
JP2532618B2 (ja) ピッチ抽出装置
JP5203404B2 (ja) テンポ値検出装置およびテンポ値検出方法
Daido et al. A Fast and Accurate Fundamental Frequency Estimator Using Recursive Moving Average Filters.
JPH09247800A (ja) 左右音像方向抽出方法
CN113314153B (zh) 语音端点检测的方法、装置、设备和存储介质
JP4360527B2 (ja) ピッチ検出方法
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
KR100539176B1 (ko) 음악적 특징 추출 방법 및 장치
JP2591802B2 (ja) 可聴音信号認識方法
JPS62141595A (ja) 音声検出方式
JP3021065U (ja) ピッチ抽出装置
CN1707610B (zh) 对两个谐波信号的共同起源的确定