JP2638829B2 - 音声ピッチ抽出装置 - Google Patents
音声ピッチ抽出装置Info
- Publication number
- JP2638829B2 JP2638829B2 JP62210690A JP21069087A JP2638829B2 JP 2638829 B2 JP2638829 B2 JP 2638829B2 JP 62210690 A JP62210690 A JP 62210690A JP 21069087 A JP21069087 A JP 21069087A JP 2638829 B2 JP2638829 B2 JP 2638829B2
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- pitch
- zero
- audio signal
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声のピッチ抽出装置に関する。
(従来の技術) 従来の音声ピッチ抽出技術としては、10〜20msの時間
窓での原音声形の自己相関やケプストラム、PARCOR等の
線形予測分析の残差の自己相関等を用いる方法が知られ
ている。この従来技術については、日本音響学会昭和55
年度秋期研究発表会講演論文集2−4−1「直接形PARC
OR分析におけるピッチ抽出の検討」等に詳述されてい
る。
窓での原音声形の自己相関やケプストラム、PARCOR等の
線形予測分析の残差の自己相関等を用いる方法が知られ
ている。この従来技術については、日本音響学会昭和55
年度秋期研究発表会講演論文集2−4−1「直接形PARC
OR分析におけるピッチ抽出の検討」等に詳述されてい
る。
(発明が解決しようとする問題点) しかしながら従来方法では、自己相関やケプストラム
の算出にかなりの計算時間が必要とされる。また、音声
パワーの小さな区間では、正確な抽出が難しい場合があ
る。そこで、いくつかの閾値を設けることによってこの
点を改善する方法等も考案されている。しかし、この閾
値の設定如何によっては、抽出誤りも生じてしまうた
め、設定すべき閾値が多くなるのは好ましくない。
の算出にかなりの計算時間が必要とされる。また、音声
パワーの小さな区間では、正確な抽出が難しい場合があ
る。そこで、いくつかの閾値を設けることによってこの
点を改善する方法等も考案されている。しかし、この閾
値の設定如何によっては、抽出誤りも生じてしまうた
め、設定すべき閾値が多くなるのは好ましくない。
そこで、本発明は、計算時間が短く、また音声パワー
の小さい区間でも誤りなくピッチが抽出できる音声ピッ
チ抽出装置を提供することを目的としている。
の小さい区間でも誤りなくピッチが抽出できる音声ピッ
チ抽出装置を提供することを目的としている。
(問題点を解決するための手段) 本発明は、サンプリングされた音声信号を入力する手
段と、 前記入力音声信号の一次差分を算出する手段と、 前記一次差分の符号の変化から前記入力音声信号のピ
ークを検出する手段と、 前記入力音声の中で最高と予測されるピッチ周波数に
相当する最短ピッチ周期を予め設定しておき、前記最短
ピッチ周期の時間間隔ごとに該時間間隔の中で振幅が最
大となるパルスを取り出してこれを声帯振動パルスとす
る手段と、 前記声帯振動パルスから時間軸をさかのぼり前記入力
音声信号の中から前記声帯振動パルスと符号が異なる最
初の入力音声信号を検出してこれを零クロス点前方パル
スとし、前記入力音声信号の中から前記零クロス点前方
パルスの次のサンプリング時刻の入力音声信号を検出し
てこれを零クロス点後方パルスとし、前記零クロス点前
方パルスと前記零クロス点後方パルスとの間を補間直線
で結び、前記補間直線が振動軸と交差する点を検出して
これを零クロス位置とする手段と、 前記クロス位置の間隔からピッチ周波数を算出する手
段と を有することを特徴とする。
段と、 前記入力音声信号の一次差分を算出する手段と、 前記一次差分の符号の変化から前記入力音声信号のピ
ークを検出する手段と、 前記入力音声の中で最高と予測されるピッチ周波数に
相当する最短ピッチ周期を予め設定しておき、前記最短
ピッチ周期の時間間隔ごとに該時間間隔の中で振幅が最
大となるパルスを取り出してこれを声帯振動パルスとす
る手段と、 前記声帯振動パルスから時間軸をさかのぼり前記入力
音声信号の中から前記声帯振動パルスと符号が異なる最
初の入力音声信号を検出してこれを零クロス点前方パル
スとし、前記入力音声信号の中から前記零クロス点前方
パルスの次のサンプリング時刻の入力音声信号を検出し
てこれを零クロス点後方パルスとし、前記零クロス点前
方パルスと前記零クロス点後方パルスとの間を補間直線
で結び、前記補間直線が振動軸と交差する点を検出して
これを零クロス位置とする手段と、 前記クロス位置の間隔からピッチ周波数を算出する手
段と を有することを特徴とする。
(作用) 第2図は、本発明の装置で行うピッチ抽出方法を説明
するための図である。
するための図である。
まず、入力された音声に帯して音声無声判定を行う。
有声無声判定には、入力音声のパワーの変化を利用する
方法等を用いることができる。有声無声判定によって有
声区間と判定された区間において、ピッチ抽出を行う。
第2図(a)は、入力音声の例を示す図である。
有声無声判定には、入力音声のパワーの変化を利用する
方法等を用いることができる。有声無声判定によって有
声区間と判定された区間において、ピッチ抽出を行う。
第2図(a)は、入力音声の例を示す図である。
次に、有声と判定された区間において、前記入力音声
の一次差分を算出する。すなわち、 Δw(i)=w(i)−w(i−1) (1) ここで、w(i)は前記入力音声波形を、Δw(i)
は前記入力音声波形の一次差分信号を表す。この一次差
分信号Δw(i)の符号の正負によって、入力音声信号
の増減の様子がわかる。すなわち、前記一次差分信号の
符号が正から負(あるいは負から正)に変わる点では、
入力音声信号がピークとなっていると考えられる。そこ
で、このような点における入力音声信号値を残し、その
他の点での値を0にすることによって、パルス化された
信号p(i)を抽出する。
の一次差分を算出する。すなわち、 Δw(i)=w(i)−w(i−1) (1) ここで、w(i)は前記入力音声波形を、Δw(i)
は前記入力音声波形の一次差分信号を表す。この一次差
分信号Δw(i)の符号の正負によって、入力音声信号
の増減の様子がわかる。すなわち、前記一次差分信号の
符号が正から負(あるいは負から正)に変わる点では、
入力音声信号がピークとなっていると考えられる。そこ
で、このような点における入力音声信号値を残し、その
他の点での値を0にすることによって、パルス化された
信号p(i)を抽出する。
第2図(b)は、上記(2)式によってパルス化され
た信号の例を示す図である。前記パルス化された信号p
(i)には、声帯の周期的振動に対応するパルス以外の
パルスも含まれているので、これらの余分なパルスを取
り除く。これには、閾値として入力音声の最高のピッチ
周波数と思われる周波数値を用いる。最高ピッチ周波数
の逆数の時間間隔内において振幅が最大となるパルス
を、声帯の周期的振動に対応するピッチパルスとする。
したがって、設定する閾値としてはこの最高ピッチ周波
数値のみでよい。第2図(c)は、このようにして抽出
されたピッチパルス列の例を示す図である。
た信号の例を示す図である。前記パルス化された信号p
(i)には、声帯の周期的振動に対応するパルス以外の
パルスも含まれているので、これらの余分なパルスを取
り除く。これには、閾値として入力音声の最高のピッチ
周波数と思われる周波数値を用いる。最高ピッチ周波数
の逆数の時間間隔内において振幅が最大となるパルス
を、声帯の周期的振動に対応するピッチパルスとする。
したがって、設定する閾値としてはこの最高ピッチ周波
数値のみでよい。第2図(c)は、このようにして抽出
されたピッチパルス列の例を示す図である。
次に、前記ピッチパルスから時間軸をさかのぼり、最
初に現れる零クロス位置を検索する。しかし、D/A変換
によって得られた前記入力音声波形は、必ずしも零クロ
ス点をサンプリングしているとは限らない。そこで、ピ
ッチ抽出の分解能を上げるために、前記入力音声波形に
おいて前記ピッチパルスと符号の異なる値を持つサンプ
ルを検出する。第3図は、零クロス位置を求める方法を
説明するための図である。前記ピッチパルスと符号の異
なる値を持つサンプルの位置(時刻)31をt、振幅32を
w(t)、真の零クロス位置33をtz、D/A変換のサンプ
リング周期をΔtとし、w(t)とW(t+Δt)との
間の前記入力音声波形を直線で近似することによって、
零クロス位置を求めることができる。すなわち、 tz=t−w(t)×Δt/(w(t+Δt)−w(t))
(3) このときの零クロス位置の間隔をピッチ周期とし、こ
の逆数をピッチ周波数として出力する。第2図(d)
は、抽出されたピッチ周波数の例を示す図である。
初に現れる零クロス位置を検索する。しかし、D/A変換
によって得られた前記入力音声波形は、必ずしも零クロ
ス点をサンプリングしているとは限らない。そこで、ピ
ッチ抽出の分解能を上げるために、前記入力音声波形に
おいて前記ピッチパルスと符号の異なる値を持つサンプ
ルを検出する。第3図は、零クロス位置を求める方法を
説明するための図である。前記ピッチパルスと符号の異
なる値を持つサンプルの位置(時刻)31をt、振幅32を
w(t)、真の零クロス位置33をtz、D/A変換のサンプ
リング周期をΔtとし、w(t)とW(t+Δt)との
間の前記入力音声波形を直線で近似することによって、
零クロス位置を求めることができる。すなわち、 tz=t−w(t)×Δt/(w(t+Δt)−w(t))
(3) このときの零クロス位置の間隔をピッチ周期とし、こ
の逆数をピッチ周波数として出力する。第2図(d)
は、抽出されたピッチ周波数の例を示す図である。
以上のように、主な処理に必要な演算は減算と大小比
較のみであり、演算の高速化が実現できる。また、入力
音声のパワーが小さい区間においても、ピーク位置を検
出することは可能である。したがって、有声子音等のよ
うに比較的パワーの小さい音声区間においても、精度良
くピッチを抽出することができる。
較のみであり、演算の高速化が実現できる。また、入力
音声のパワーが小さい区間においても、ピーク位置を検
出することは可能である。したがって、有声子音等のよ
うに比較的パワーの小さい音声区間においても、精度良
くピッチを抽出することができる。
(実施例) 第1図は、本発明による音声ピッチ抽出装置の一実施
例を示すブロック図である。
例を示すブロック図である。
音声入力端子11から入力された音声は、有声無声判定
部12において有声区間が検出される。ピッチ抽出は、有
声と判定された区間においてのみ行われる。一次差分算
出部13では、前記入力音声のうち有声と判定された区間
において一次差分を算出する。パルス抽出部14では、隣
合った一次差分値の符号が正から負(あるいは負から
正)に変化する点を音声波形のピークとして取り出し、
パルス化された信号を作る。
部12において有声区間が検出される。ピッチ抽出は、有
声と判定された区間においてのみ行われる。一次差分算
出部13では、前記入力音声のうち有声と判定された区間
において一次差分を算出する。パルス抽出部14では、隣
合った一次差分値の符号が正から負(あるいは負から
正)に変化する点を音声波形のピークとして取り出し、
パルス化された信号を作る。
ピッチパルス抽出部15では、前記パルス化された信号
から声帯の周期的振動に対応するパルスを抽出する。す
なわち、前記入力音声において最高と思われるピッチ周
波数の逆数(最短ピッチ周期)の時間長の区間におい
て、振幅が最大のパルスを探索し、その区間内の他のパ
ルスを削除することによって、ピッチパルスを抽出す
る。零クロス位置検出部16では、ピッチパルス抽出部15
で得られたピッチパルスから時間軸をさかのぼって零ク
ロス位置を検出する。
から声帯の周期的振動に対応するパルスを抽出する。す
なわち、前記入力音声において最高と思われるピッチ周
波数の逆数(最短ピッチ周期)の時間長の区間におい
て、振幅が最大のパルスを探索し、その区間内の他のパ
ルスを削除することによって、ピッチパルスを抽出す
る。零クロス位置検出部16では、ピッチパルス抽出部15
で得られたピッチパルスから時間軸をさかのぼって零ク
ロス位置を検出する。
ピッチ周波数算出部17では、前記零クロス位置の間隔
の逆数を計算してピッチ周波数とし、ピッチ周波数出力
端子18から出力する。
の逆数を計算してピッチ周波数とし、ピッチ周波数出力
端子18から出力する。
(発明の効果) 以上に述べてきたように本発明によれば、処理速度が
速く、また入力音声のパワーが比較的小さい区間におい
ても精度の良い抽出が可能な音声ピッチ抽出装置を実現
できる。
速く、また入力音声のパワーが比較的小さい区間におい
ても精度の良い抽出が可能な音声ピッチ抽出装置を実現
できる。
第1図は本発明による音声ピッチ抽出装置の一実施例を
示すブロック図、第2図は本発明の装置で行うピッチ抽
出方法を説明するための図、第3図は零クロス位置を求
める方法を説明するための図である。 図において、11は音声入力端子、12は有声無声判定部、
13は一次差分算出部、14はパルス抽出部、15はピッチパ
ルス抽出部、16は零クロス位置検出部、17はピッチ周波
数算出部、18はピッチ周波数出力端子である。
示すブロック図、第2図は本発明の装置で行うピッチ抽
出方法を説明するための図、第3図は零クロス位置を求
める方法を説明するための図である。 図において、11は音声入力端子、12は有声無声判定部、
13は一次差分算出部、14はパルス抽出部、15はピッチパ
ルス抽出部、16は零クロス位置検出部、17はピッチ周波
数算出部、18はピッチ周波数出力端子である。
Claims (1)
- 【請求項1】サンプリングされた音声信号を入力する手
段と、 前記入力音声信号の一次差分を算出する手段と、 前記一次差分の符号の変化から前記入力音声信号のピー
クを検出する手段と、 前記入力音声の中で最高と予測されるピッチ周波数に相
当する最短ピッチ周期を予め設定しておき、前記最短ピ
ッチ周期の時間間隔ごとに該時間間隔の中で振幅が最大
となるパルスを取り出してこれを声帯振動パルスとする
手段と、 前記声帯振動パルスから時間軸をさかのぼり前記入力音
声信号の中から前記声帯振動パルスと符号が異なる最初
の入力音声信号を検出してこれを零クロス点前方パルス
とし、前記入力音声信号の中から前記零クロス点前方パ
ルスの次のサンプリング時刻の入力音声信号を検出して
これを零クロス点後方パルスとし、前記零クロス点前方
パルスと前記零クロス点後方パルスとの間を補間直線で
結び、前記補間直線が振動軸と交差する点を検出してこ
れを零クロス位置とする手段と、 前記クロス位置の間隔からピッチ周波数を算出する手段
と を有することを特徴とする音声ピッチ抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62210690A JP2638829B2 (ja) | 1987-08-24 | 1987-08-24 | 音声ピッチ抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62210690A JP2638829B2 (ja) | 1987-08-24 | 1987-08-24 | 音声ピッチ抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6454500A JPS6454500A (en) | 1989-03-01 |
JP2638829B2 true JP2638829B2 (ja) | 1997-08-06 |
Family
ID=16593492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62210690A Expired - Fee Related JP2638829B2 (ja) | 1987-08-24 | 1987-08-24 | 音声ピッチ抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2638829B2 (ja) |
-
1987
- 1987-08-24 JP JP62210690A patent/JP2638829B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPS6454500A (en) | 1989-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3162994B2 (ja) | 音声のワードを認識する方法及び音声のワードを識別するシステム | |
JPS597120B2 (ja) | 音声分析装置 | |
KR940024660A (ko) | 음성인식장치 | |
JP2003295880A (ja) | 録音音声と合成音声を接続する音声合成システム | |
US5452398A (en) | Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change | |
JP2638829B2 (ja) | 音声ピッチ抽出装置 | |
KR0136608B1 (ko) | 음성신호 검색용 음성인식 장치 | |
CN113793581A (zh) | 一种基于运动检测辅助识别的打击乐智能教育系统 | |
JP2643202B2 (ja) | 入力音声の定常部、過渡部、不確定部の検出装置 | |
JPH0122639B2 (ja) | ||
JP2001083978A (ja) | 音声認識装置 | |
JPS6220560B2 (ja) | ||
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
JP2583854B2 (ja) | 有声無声判定方法 | |
JP4890792B2 (ja) | 音声認識方法 | |
JPH0766272B2 (ja) | 音声セグメンテ−ション装置 | |
JP3032215B2 (ja) | 有音検出装置及びその方法 | |
EP0245252A1 (en) | System and method for sound recognition with feature selection synchronized to voice pitch | |
JP2707577B2 (ja) | ホルマント抽出装置 | |
JP3049711B2 (ja) | 音声処理装置 | |
JPH05241596A (ja) | 音声の基本周波数抽出システム | |
Buza et al. | Algorithm for detection of voice signal periodicity | |
JP2679039B2 (ja) | 母音切出し装置 | |
Sarma et al. | Detection of vowel onset points in voiced aspirated sounds of indian languages. | |
JPH04211299A (ja) | 単音節音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |