JP2638829B2 - 音声ピッチ抽出装置 - Google Patents

音声ピッチ抽出装置

Info

Publication number
JP2638829B2
JP2638829B2 JP62210690A JP21069087A JP2638829B2 JP 2638829 B2 JP2638829 B2 JP 2638829B2 JP 62210690 A JP62210690 A JP 62210690A JP 21069087 A JP21069087 A JP 21069087A JP 2638829 B2 JP2638829 B2 JP 2638829B2
Authority
JP
Japan
Prior art keywords
pulse
pitch
zero
audio signal
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62210690A
Other languages
English (en)
Other versions
JPS6454500A (en
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62210690A priority Critical patent/JP2638829B2/ja
Publication of JPS6454500A publication Critical patent/JPS6454500A/ja
Application granted granted Critical
Publication of JP2638829B2 publication Critical patent/JP2638829B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声のピッチ抽出装置に関する。
(従来の技術) 従来の音声ピッチ抽出技術としては、10〜20msの時間
窓での原音声形の自己相関やケプストラム、PARCOR等の
線形予測分析の残差の自己相関等を用いる方法が知られ
ている。この従来技術については、日本音響学会昭和55
年度秋期研究発表会講演論文集2−4−1「直接形PARC
OR分析におけるピッチ抽出の検討」等に詳述されてい
る。
(発明が解決しようとする問題点) しかしながら従来方法では、自己相関やケプストラム
の算出にかなりの計算時間が必要とされる。また、音声
パワーの小さな区間では、正確な抽出が難しい場合があ
る。そこで、いくつかの閾値を設けることによってこの
点を改善する方法等も考案されている。しかし、この閾
値の設定如何によっては、抽出誤りも生じてしまうた
め、設定すべき閾値が多くなるのは好ましくない。
そこで、本発明は、計算時間が短く、また音声パワー
の小さい区間でも誤りなくピッチが抽出できる音声ピッ
チ抽出装置を提供することを目的としている。
(問題点を解決するための手段) 本発明は、サンプリングされた音声信号を入力する手
段と、 前記入力音声信号の一次差分を算出する手段と、 前記一次差分の符号の変化から前記入力音声信号のピ
ークを検出する手段と、 前記入力音声の中で最高と予測されるピッチ周波数に
相当する最短ピッチ周期を予め設定しておき、前記最短
ピッチ周期の時間間隔ごとに該時間間隔の中で振幅が最
大となるパルスを取り出してこれを声帯振動パルスとす
る手段と、 前記声帯振動パルスから時間軸をさかのぼり前記入力
音声信号の中から前記声帯振動パルスと符号が異なる最
初の入力音声信号を検出してこれを零クロス点前方パル
スとし、前記入力音声信号の中から前記零クロス点前方
パルスの次のサンプリング時刻の入力音声信号を検出し
てこれを零クロス点後方パルスとし、前記零クロス点前
方パルスと前記零クロス点後方パルスとの間を補間直線
で結び、前記補間直線が振動軸と交差する点を検出して
これを零クロス位置とする手段と、 前記クロス位置の間隔からピッチ周波数を算出する手
段と を有することを特徴とする。
(作用) 第2図は、本発明の装置で行うピッチ抽出方法を説明
するための図である。
まず、入力された音声に帯して音声無声判定を行う。
有声無声判定には、入力音声のパワーの変化を利用する
方法等を用いることができる。有声無声判定によって有
声区間と判定された区間において、ピッチ抽出を行う。
第2図(a)は、入力音声の例を示す図である。
次に、有声と判定された区間において、前記入力音声
の一次差分を算出する。すなわち、 Δw(i)=w(i)−w(i−1) (1) ここで、w(i)は前記入力音声波形を、Δw(i)
は前記入力音声波形の一次差分信号を表す。この一次差
分信号Δw(i)の符号の正負によって、入力音声信号
の増減の様子がわかる。すなわち、前記一次差分信号の
符号が正から負(あるいは負から正)に変わる点では、
入力音声信号がピークとなっていると考えられる。そこ
で、このような点における入力音声信号値を残し、その
他の点での値を0にすることによって、パルス化された
信号p(i)を抽出する。
第2図(b)は、上記(2)式によってパルス化され
た信号の例を示す図である。前記パルス化された信号p
(i)には、声帯の周期的振動に対応するパルス以外の
パルスも含まれているので、これらの余分なパルスを取
り除く。これには、閾値として入力音声の最高のピッチ
周波数と思われる周波数値を用いる。最高ピッチ周波数
の逆数の時間間隔内において振幅が最大となるパルス
を、声帯の周期的振動に対応するピッチパルスとする。
したがって、設定する閾値としてはこの最高ピッチ周波
数値のみでよい。第2図(c)は、このようにして抽出
されたピッチパルス列の例を示す図である。
次に、前記ピッチパルスから時間軸をさかのぼり、最
初に現れる零クロス位置を検索する。しかし、D/A変換
によって得られた前記入力音声波形は、必ずしも零クロ
ス点をサンプリングしているとは限らない。そこで、ピ
ッチ抽出の分解能を上げるために、前記入力音声波形に
おいて前記ピッチパルスと符号の異なる値を持つサンプ
ルを検出する。第3図は、零クロス位置を求める方法を
説明するための図である。前記ピッチパルスと符号の異
なる値を持つサンプルの位置(時刻)31をt、振幅32を
w(t)、真の零クロス位置33をtz、D/A変換のサンプ
リング周期をΔtとし、w(t)とW(t+Δt)との
間の前記入力音声波形を直線で近似することによって、
零クロス位置を求めることができる。すなわち、 tz=t−w(t)×Δt/(w(t+Δt)−w(t))
(3) このときの零クロス位置の間隔をピッチ周期とし、こ
の逆数をピッチ周波数として出力する。第2図(d)
は、抽出されたピッチ周波数の例を示す図である。
以上のように、主な処理に必要な演算は減算と大小比
較のみであり、演算の高速化が実現できる。また、入力
音声のパワーが小さい区間においても、ピーク位置を検
出することは可能である。したがって、有声子音等のよ
うに比較的パワーの小さい音声区間においても、精度良
くピッチを抽出することができる。
(実施例) 第1図は、本発明による音声ピッチ抽出装置の一実施
例を示すブロック図である。
音声入力端子11から入力された音声は、有声無声判定
部12において有声区間が検出される。ピッチ抽出は、有
声と判定された区間においてのみ行われる。一次差分算
出部13では、前記入力音声のうち有声と判定された区間
において一次差分を算出する。パルス抽出部14では、隣
合った一次差分値の符号が正から負(あるいは負から
正)に変化する点を音声波形のピークとして取り出し、
パルス化された信号を作る。
ピッチパルス抽出部15では、前記パルス化された信号
から声帯の周期的振動に対応するパルスを抽出する。す
なわち、前記入力音声において最高と思われるピッチ周
波数の逆数(最短ピッチ周期)の時間長の区間におい
て、振幅が最大のパルスを探索し、その区間内の他のパ
ルスを削除することによって、ピッチパルスを抽出す
る。零クロス位置検出部16では、ピッチパルス抽出部15
で得られたピッチパルスから時間軸をさかのぼって零ク
ロス位置を検出する。
ピッチ周波数算出部17では、前記零クロス位置の間隔
の逆数を計算してピッチ周波数とし、ピッチ周波数出力
端子18から出力する。
(発明の効果) 以上に述べてきたように本発明によれば、処理速度が
速く、また入力音声のパワーが比較的小さい区間におい
ても精度の良い抽出が可能な音声ピッチ抽出装置を実現
できる。
【図面の簡単な説明】
第1図は本発明による音声ピッチ抽出装置の一実施例を
示すブロック図、第2図は本発明の装置で行うピッチ抽
出方法を説明するための図、第3図は零クロス位置を求
める方法を説明するための図である。 図において、11は音声入力端子、12は有声無声判定部、
13は一次差分算出部、14はパルス抽出部、15はピッチパ
ルス抽出部、16は零クロス位置検出部、17はピッチ周波
数算出部、18はピッチ周波数出力端子である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】サンプリングされた音声信号を入力する手
    段と、 前記入力音声信号の一次差分を算出する手段と、 前記一次差分の符号の変化から前記入力音声信号のピー
    クを検出する手段と、 前記入力音声の中で最高と予測されるピッチ周波数に相
    当する最短ピッチ周期を予め設定しておき、前記最短ピ
    ッチ周期の時間間隔ごとに該時間間隔の中で振幅が最大
    となるパルスを取り出してこれを声帯振動パルスとする
    手段と、 前記声帯振動パルスから時間軸をさかのぼり前記入力音
    声信号の中から前記声帯振動パルスと符号が異なる最初
    の入力音声信号を検出してこれを零クロス点前方パルス
    とし、前記入力音声信号の中から前記零クロス点前方パ
    ルスの次のサンプリング時刻の入力音声信号を検出して
    これを零クロス点後方パルスとし、前記零クロス点前方
    パルスと前記零クロス点後方パルスとの間を補間直線で
    結び、前記補間直線が振動軸と交差する点を検出してこ
    れを零クロス位置とする手段と、 前記クロス位置の間隔からピッチ周波数を算出する手段
    と を有することを特徴とする音声ピッチ抽出装置。
JP62210690A 1987-08-24 1987-08-24 音声ピッチ抽出装置 Expired - Fee Related JP2638829B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62210690A JP2638829B2 (ja) 1987-08-24 1987-08-24 音声ピッチ抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62210690A JP2638829B2 (ja) 1987-08-24 1987-08-24 音声ピッチ抽出装置

Publications (2)

Publication Number Publication Date
JPS6454500A JPS6454500A (en) 1989-03-01
JP2638829B2 true JP2638829B2 (ja) 1997-08-06

Family

ID=16593492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62210690A Expired - Fee Related JP2638829B2 (ja) 1987-08-24 1987-08-24 音声ピッチ抽出装置

Country Status (1)

Country Link
JP (1) JP2638829B2 (ja)

Also Published As

Publication number Publication date
JPS6454500A (en) 1989-03-01

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
JPS597120B2 (ja) 音声分析装置
KR940024660A (ko) 음성인식장치
JP2003295880A (ja) 録音音声と合成音声を接続する音声合成システム
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
JP2638829B2 (ja) 音声ピッチ抽出装置
KR0136608B1 (ko) 음성신호 검색용 음성인식 장치
CN113793581A (zh) 一种基于运动检测辅助识别的打击乐智能教育系统
JP2643202B2 (ja) 入力音声の定常部、過渡部、不確定部の検出装置
JPH0122639B2 (ja)
JP2001083978A (ja) 音声認識装置
JPS6220560B2 (ja)
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JP2583854B2 (ja) 有声無声判定方法
JP4890792B2 (ja) 音声認識方法
JPH0766272B2 (ja) 音声セグメンテ−ション装置
JP3032215B2 (ja) 有音検出装置及びその方法
EP0245252A1 (en) System and method for sound recognition with feature selection synchronized to voice pitch
JP2707577B2 (ja) ホルマント抽出装置
JP3049711B2 (ja) 音声処理装置
JPH05241596A (ja) 音声の基本周波数抽出システム
Buza et al. Algorithm for detection of voice signal periodicity
JP2679039B2 (ja) 母音切出し装置
Sarma et al. Detection of vowel onset points in voiced aspirated sounds of indian languages.
JPH04211299A (ja) 単音節音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees