JPS605000A - ピツチ抽出装置 - Google Patents
ピツチ抽出装置Info
- Publication number
- JPS605000A JPS605000A JP58113705A JP11370583A JPS605000A JP S605000 A JPS605000 A JP S605000A JP 58113705 A JP58113705 A JP 58113705A JP 11370583 A JP11370583 A JP 11370583A JP S605000 A JPS605000 A JP S605000A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- waveform
- value
- audio waveform
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Working-Up Tar And Pitch (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、音声波形を任意の区間に分割し、区間毎に自
己相関係数を算出してピッチ抽出を行なうピンチ抽出装
置に関するものである。
己相関係数を算出してピッチ抽出を行なうピンチ抽出装
置に関するものである。
従来例の構成とその問題点
音声波形における有声音部分は周期的な繰り返し波形を
持ちその周期(ピッチ)の変化特性は、音声処理におい
ては重要なパラメータであることが知られている。音声
の分析合成系においては、分析時に抽出したピッチの抽
出結果が合成時における合成音の品質に大きな影響を与
える。
持ちその周期(ピッチ)の変化特性は、音声処理におい
ては重要なパラメータであることが知られている。音声
の分析合成系においては、分析時に抽出したピッチの抽
出結果が合成時における合成音の品質に大きな影響を与
える。
音声波形のピンチ抽出方法としては、従来から音声信号
をある時間長で分割するフレーム毎に音声信号の自己相
関係数を算出し抽出する方法が広く用いられている。し
かしながら前記方法は、正しいピッチの倍周期や半周期
の成分などを誤ってピッチとして抽出したり、その演算
の複雑さから多くの演算時間を必要とするだめ音声の実
時間分析には適さない。捷だ実時間分析を行なう様にノ
・−ドウェア構成を考えた場合にも、前記理由により高
速な演算処理装置を必要とするなどの欠点を有している
。
をある時間長で分割するフレーム毎に音声信号の自己相
関係数を算出し抽出する方法が広く用いられている。し
かしながら前記方法は、正しいピッチの倍周期や半周期
の成分などを誤ってピッチとして抽出したり、その演算
の複雑さから多くの演算時間を必要とするだめ音声の実
時間分析には適さない。捷だ実時間分析を行なう様にノ
・−ドウェア構成を考えた場合にも、前記理由により高
速な演算処理装置を必要とするなどの欠点を有している
。
前記演算時間を短縮する方法として音声波形だだし、(
+、:Lきい値 によって非線形変換し、その非線形変換した二値の相関
係数を演算してピッチを抽出する方法が提案されている
。しかしながらこの方法においても、正しいピッチの倍
周期や半周期などの成分を誤ってピッチとして抽出する
という欠点を有している。
+、:Lきい値 によって非線形変換し、その非線形変換した二値の相関
係数を演算してピッチを抽出する方法が提案されている
。しかしながらこの方法においても、正しいピッチの倍
周期や半周期などの成分を誤ってピッチとして抽出する
という欠点を有している。
発明の目的
本発明は、以上のような従来の問題点を解決するもので
、ピッチ抽出において従来に比べて演や処理量が少なく
かつピッチ誤抽出を大幅に減少し得るピッチ抽出装置を
提−供することを目的とする。
、ピッチ抽出において従来に比べて演や処理量が少なく
かつピッチ誤抽出を大幅に減少し得るピッチ抽出装置を
提−供することを目的とする。
発明の構成
この目的を達成するだめに本発明は、任意の区間に分割
した音声波形を、しきい値によって非線形変換してyl
(n)、y2(n)を得、これらの関数の相関値P(τ
)をめP(τ)が最大になるτの値をピンチとする過程
において、音声波形を前半部と後半部に分割して、分割
した部分の境界を中心としたあらかじめ定められた領域
を除去した二つの部分の最大値を別々にめ、このめた二
つの最大値からしきい値を決定し、このしきい値−を前
記任意の区間毎に可変にするようにしたピッチ抽出装置
を提供するものである。
した音声波形を、しきい値によって非線形変換してyl
(n)、y2(n)を得、これらの関数の相関値P(τ
)をめP(τ)が最大になるτの値をピンチとする過程
において、音声波形を前半部と後半部に分割して、分割
した部分の境界を中心としたあらかじめ定められた領域
を除去した二つの部分の最大値を別々にめ、このめた二
つの最大値からしきい値を決定し、このしきい値−を前
記任意の区間毎に可変にするようにしたピッチ抽出装置
を提供するものである。
実施例の説明
ワ、1本発明の一実施例を図面を用いて説明する。
第1図は本発明の詳細な説明するだめのブロック図であ
る。
る。
音声波形が、A/D変換器1に入力される。
、A/D変換器1は、音声波形をあらかじめ定められた
周波数で標本化しく普通、電話音声程度の音質であれば
、標本化周波数は8KHz、音声波形の振幅の量子化は
8ビツトで充分であり、以下この数値を用いて説明する
。)、音声波形を離散的な時系列信号に変換した標本化
音声波形をデータ量くノファメモリ2へ出カスる。デー
タバッファメモリ2は標本化音声波形を一時的に記憶し
、分析フレーム周期分の標本化音声波形を記憶した時点
で、標本化音声波形の前半部からあらかじめ定められた
領域を除いた後の部分を前半部最大値検出回路3へ、標
本化音声波形の後半部からあらかじめ定められた領域を
除いた後の部分を後半部最大値検出回路4へ出力する。
周波数で標本化しく普通、電話音声程度の音質であれば
、標本化周波数は8KHz、音声波形の振幅の量子化は
8ビツトで充分であり、以下この数値を用いて説明する
。)、音声波形を離散的な時系列信号に変換した標本化
音声波形をデータ量くノファメモリ2へ出カスる。デー
タバッファメモリ2は標本化音声波形を一時的に記憶し
、分析フレーム周期分の標本化音声波形を記憶した時点
で、標本化音声波形の前半部からあらかじめ定められた
領域を除いた後の部分を前半部最大値検出回路3へ、標
本化音声波形の後半部からあらかじめ定められた領域を
除いた後の部分を後半部最大値検出回路4へ出力する。
ここで除く領域は前半部と後半部の境界に隣接しかつ最
大値を含む領域である。なお前半部と後半部の標本化音
声波形のデータ量は等しくする。
大値を含む領域である。なお前半部と後半部の標本化音
声波形のデータ量は等しくする。
前半部最大値検出回路3は、前記標本化音声波形の前半
部からあらかじめ定められた領域を除いた部分の最大値
MAX1をめ、しきい値決定回路6へ出力する。後半部
最大値検出回路4に1、前記標本化音声波形の後半部か
らあらかじめ定められた領域を除いた部分の最大値MA
X2をめ、しきい値決定回路5へ出力する。
部からあらかじめ定められた領域を除いた部分の最大値
MAX1をめ、しきい値決定回路6へ出力する。後半部
最大値検出回路4に1、前記標本化音声波形の後半部か
らあらかじめ定められた領域を除いた部分の最大値MA
X2をめ、しきい値決定回路5へ出力する。
し7きい値決定回路6は前記最大値MAX1及び最大値
MAX2を基に次の3.4.6式によってしきい値CL
を決定する。
MAX2を基に次の3.4.6式によってしきい値CL
を決定する。
IMAX = max(MAXl 、MAX2)−=(
3)IMAX1= min(MAXl 、MAX2)−
(4)OL= m1n(IMAX、 o、e、 IMA
X、0.8 )・・・・・(5) ここでmax(1)はどちらか絶対値の大きい方を、m
1n(’ + )はどちらか絶対値の小さい方を選択す
る意味である。
3)IMAX1= min(MAXl 、MAX2)−
(4)OL= m1n(IMAX、 o、e、 IMA
X、0.8 )・・・・・(5) ここでmax(1)はどちらか絶対値の大きい方を、m
1n(’ + )はどちらか絶対値の小さい方を選択す
る意味である。
しきい値決定回路6は、この決定されたしきい値OLを
、非線形変換回路6及び三値分類回路7へ出力する。
、非線形変換回路6及び三値分類回路7へ出力する。
ここで本発明のしきい値決定方法を、第2図を用いて説
明する。
明する。
分析フレームA)でおいてピッチは波高値304と30
1との間隔Tであることは明白である。いま分析フレー
ム人の全振幅情報からしきい値を決定すると、分析フレ
ーム人の前半部A1 の最大値は波高値301であり、
後半部A2の最大値は波高値302であるから、前記式
3,4.5からしきい値は、しきい値303が導かれる
。しかしながらしきい値303は、波高値304を越え
ており、波高値304を使用しないのでピッチ抽出の際
にピッチT以外の誤ったピンチを抽出する。
1との間隔Tであることは明白である。いま分析フレー
ム人の全振幅情報からしきい値を決定すると、分析フレ
ーム人の前半部A1 の最大値は波高値301であり、
後半部A2の最大値は波高値302であるから、前記式
3,4.5からしきい値は、しきい値303が導かれる
。しかしながらしきい値303は、波高値304を越え
ており、波高値304を使用しないのでピッチ抽出の際
にピッチT以外の誤ったピンチを抽出する。
これに対し本発明のしきい値決定法では分析フレーム人
において、分析フレーム人を前半部ム1う後半部A2に
分割し前半部ム1と後半部A2の境界、す々わち分析フ
レーム人の中間点305を中心としたあらかじめ定めら
れた領域306を除去した後の分析フレーム人の振幅情
報から前記前半部最大値検出回路3及び後半部最大値検
出回路4にて前半部最大値は波高値307、後半部の最
大値は波高値308が検出され、次に前記しきい値決定
回路6によって波高値307の60%の値がしきい値3
09として決定される。この結果波高値304ij:見
落されずピンチ抽出−においてはピッチTが得られる。
において、分析フレーム人を前半部ム1う後半部A2に
分割し前半部ム1と後半部A2の境界、す々わち分析フ
レーム人の中間点305を中心としたあらかじめ定めら
れた領域306を除去した後の分析フレーム人の振幅情
報から前記前半部最大値検出回路3及び後半部最大値検
出回路4にて前半部最大値は波高値307、後半部の最
大値は波高値308が検出され、次に前記しきい値決定
回路6によって波高値307の60%の値がしきい値3
09として決定される。この結果波高値304ij:見
落されずピンチ抽出−においてはピッチTが得られる。
再び第1図にもどり、非線形変換回路6は、バッファメ
モリ2から転送され一時的に記憶されている標本化音声
波形を、しきい値決定回路5で前述のようにして決めら
れたしきい値CLを基に前記1式に従って非線形変換す
る。
モリ2から転送され一時的に記憶されている標本化音声
波形を、しきい値決定回路5で前述のようにして決めら
れたしきい値CLを基に前記1式に従って非線形変換す
る。
第3図は非線形変換回路6によって標本化音声波形を非
線形変換した例である。第3図aは、標本化音声波形、
bは、非線形変換後の標本化音声波形である。非線形変
換回路6は、非線形変換した標本化音声波形をピッチ算
出回路8へ出力する。
線形変換した例である。第3図aは、標本化音声波形、
bは、非線形変換後の標本化音声波形である。非線形変
換回路6は、非線形変換した標本化音声波形をピッチ算
出回路8へ出力する。
三値分類回路7は、前記バッファメモリ2から転送され
一時的に記憶されている前記標本化音声波形を、しきい
値OLを基に前記2式に従って三値に分類し、ピッチ算
出回路8へ出力する。第4図は三値分類回路7によって
標本化音声波形を前記2式のように三値分類した例であ
る。第4図aは、標本化音声波形、bは、三値分類後の
信号である。
一時的に記憶されている前記標本化音声波形を、しきい
値OLを基に前記2式に従って三値に分類し、ピッチ算
出回路8へ出力する。第4図は三値分類回路7によって
標本化音声波形を前記2式のように三値分類した例であ
る。第4図aは、標本化音声波形、bは、三値分類後の
信号である。
ピッチ算出回路8は、非線形変換回路6及び三値分類回
路Tを介して供給さ7′1.たy+ in) l y2
(n)の信号に基づいて次の6式に従って相関係数p(
τ)をめる。
路Tを介して供給さ7′1.たy+ in) l y2
(n)の信号に基づいて次の6式に従って相関係数p(
τ)をめる。
N−τ
(i=1.・・・・・・N)
ただし1フレーム当りの標本化音声波形の個数はN個と
する。
する。
通常の成人男女のピッチの変化範囲は60H2〜400
H2であり、この範囲を探索すると、τの範囲は、τ二
2Q〜160である。前記6式からめられたP(τ)の
中で最大値を取るものをP岨は6)とするとその時のτ
。をピッチとして抽出する。
H2であり、この範囲を探索すると、τの範囲は、τ二
2Q〜160である。前記6式からめられたP(τ)の
中で最大値を取るものをP岨は6)とするとその時のτ
。をピッチとして抽出する。
発明の詳細
な説明したように本発明は、音声波形の振幅の状態によ
って、しきい値OLを分析フレーム周期毎に″変化させ
て、その値によって音声波形を非線形変換し、!/ 1
(n) 2.!/2 (n)を演算L〜1.3h (n
) 、!2(n)の相関係数を演算すぎようにしたピッ
チ抽出装置゛ ° 5 で演算時間 が短かくかつピッチの誤抽出を防止することが可能であ
る。
って、しきい値OLを分析フレーム周期毎に″変化させ
て、その値によって音声波形を非線形変換し、!/ 1
(n) 2.!/2 (n)を演算L〜1.3h (n
) 、!2(n)の相関係数を演算すぎようにしたピッ
チ抽出装置゛ ° 5 で演算時間 が短かくかつピッチの誤抽出を防止することが可能であ
る。
第1図は本発明の一実施例におけるピッチ抽出装置を説
明するだめのブロック図、第2図は従来例および本発明
におけるしきい値決定方法を説明するための波形図、第
3図(a)、 (bjは本発明に使用される非線形変換
回路の特性図、第4図(’a)、 (b)は本発明に使
用される三値分類回路の特性図である。 1・・・・・・A/D変換器、2・・・・・・データバ
ッファメモリ、3・・・・・・前半部最大値検出回路、
4・・・・・・後半部最大値検出回路、6・・・・・・
しきい値決定回路、6・・・・・・非線形変換回路、7
・・・・・・三値分類回路、8・・・・・・ピッチ算出
回路。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 C) 第4図 <a)
明するだめのブロック図、第2図は従来例および本発明
におけるしきい値決定方法を説明するための波形図、第
3図(a)、 (bjは本発明に使用される非線形変換
回路の特性図、第4図(’a)、 (b)は本発明に使
用される三値分類回路の特性図である。 1・・・・・・A/D変換器、2・・・・・・データバ
ッファメモリ、3・・・・・・前半部最大値検出回路、
4・・・・・・後半部最大値検出回路、6・・・・・・
しきい値決定回路、6・・・・・・非線形変換回路、7
・・・・・・三値分類回路、8・・・・・・ピッチ算出
回路。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第3
図 C) 第4図 <a)
Claims (1)
- (1)任意の区間に分割した音声波形の各区間において
音声波形を前半部と後半部に分割し、前半部と後半部の
境界を中心として予め定められた領域を除去した2つの
部分の音声波形の最大値をもとにして各区間のしきい値
を決定し、このしきい値によって音声波形を非線形変換
して得だ関数の相関によりピッチを抽出することを特徴
とするピッチ抽出装置。 (謁 非線形変換が次式 %式%) ) ) ( ) (ただし、x(n)は音声波形、c、はしき゛パ伝値)
に従って演算された特許請求の範囲第1項記載のピッチ
抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58113705A JPS605000A (ja) | 1983-06-23 | 1983-06-23 | ピツチ抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58113705A JPS605000A (ja) | 1983-06-23 | 1983-06-23 | ピツチ抽出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS605000A true JPS605000A (ja) | 1985-01-11 |
Family
ID=14619076
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58113705A Pending JPS605000A (ja) | 1983-06-23 | 1983-06-23 | ピツチ抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS605000A (ja) |
-
1983
- 1983-06-23 JP JP58113705A patent/JPS605000A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2004538525A (ja) | 周波数分析によるピッチ判断方法および装置 | |
| US4081605A (en) | Speech signal fundamental period extractor | |
| JP3402748B2 (ja) | 音声信号のピッチ周期抽出装置 | |
| US5452398A (en) | Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change | |
| US4388491A (en) | Speech pitch period extraction apparatus | |
| US7231346B2 (en) | Speech section detection apparatus | |
| JPS605000A (ja) | ピツチ抽出装置 | |
| JP3422716B2 (ja) | 話速変換方法および装置および話速変換プログラムを格納した記録媒体 | |
| JP2992324B2 (ja) | 音声区間検出方法 | |
| JP4166405B2 (ja) | 駆動信号分析装置 | |
| JPS60225200A (ja) | 音声符号化器 | |
| JPH026080B2 (ja) | ||
| KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
| JPH0114599B2 (ja) | ||
| KR950009329B1 (ko) | 캠코더의 환경잡음 제거장치 | |
| JP2602641B2 (ja) | 音声符号化方式 | |
| JP2583854B2 (ja) | 有声無声判定方法 | |
| KR940002853B1 (ko) | 음성신호의 시작점 및 끝점의 적응적 추출방법 | |
| JP2557497B2 (ja) | 男女声の識別方法 | |
| JPS59102296A (ja) | ピツチ抽出方法 | |
| JP3032215B2 (ja) | 有音検出装置及びその方法 | |
| KR100523905B1 (ko) | 이중화된 검출조건을 이용한 음성 추출 방법 | |
| JP4007628B2 (ja) | 音声ピッチの周期の正規化を行う音声合成装置 | |
| JPS6267598A (ja) | 音声区間検出方式 | |
| JPS607499A (ja) | ピツチ抽出回路 |