JPS63153599A - ピツチ抽出回路 - Google Patents
ピツチ抽出回路Info
- Publication number
- JPS63153599A JPS63153599A JP30213086A JP30213086A JPS63153599A JP S63153599 A JPS63153599 A JP S63153599A JP 30213086 A JP30213086 A JP 30213086A JP 30213086 A JP30213086 A JP 30213086A JP S63153599 A JPS63153599 A JP S63153599A
- Authority
- JP
- Japan
- Prior art keywords
- section
- pitch
- short
- pinch
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims description 56
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 7
- 239000011295 pitch Substances 0.000 description 42
- 238000005311 autocorrelation function Methods 0.000 description 32
- 230000007704 transition Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 17
- 238000000034 method Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Working-Up Tar And Pitch (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
入力音声を短時間エネルギ関数の変化状態から予め定め
られた形式に分類し、各分類に対応したピンチ抽出手段
によりそれぞれピッチを抽出することにより、形式毎に
好適なピッチ抽出手法が適用可能とする。
られた形式に分類し、各分類に対応したピンチ抽出手段
によりそれぞれピッチを抽出することにより、形式毎に
好適なピッチ抽出手法が適用可能とする。
本発明は、音声からピンチを抽出するピンチ抽出回路の
改良に関する。
改良に関する。
通常人間が発する音声は、実際に音声が発せられている
状態、音声が発せられていない状態が時系列的に混在し
、また実際に音声が発せられている状態にあっても、有
声音が発せられている状態と、無声音が発せられている
状態とが混在する(以後音声が発声されていない状態を
含めて無声音と称する)。また実際に発声されている有
声音または無声音も、種々異なる音韻から構成されてい
る。
状態、音声が発せられていない状態が時系列的に混在し
、また実際に音声が発せられている状態にあっても、有
声音が発せられている状態と、無声音が発せられている
状態とが混在する(以後音声が発声されていない状態を
含めて無声音と称する)。また実際に発声されている有
声音または無声音も、種々異なる音韻から構成されてい
る。
この様に変化する音声から、音声処理上で重要なパラメ
タであるピッチを、高精度に抽出する手段の実現が強く
要望される。
タであるピッチを、高精度に抽出する手段の実現が強く
要望される。
第9図は従来あるピッチ抽出回路の一例を示す図である
。
。
第9図において、自己相関関数算出回路2は、入力端子
1から入力される音声Xに対し、エネルギで正規化した
短時間自己相関関数R(i) (以後単に自己相関関
数と称する)を(1)式に基づき算出し、ピッチ抽出論
理回路3に伝達する。
1から入力される音声Xに対し、エネルギで正規化した
短時間自己相関関数R(i) (以後単に自己相関関
数と称する)を(1)式に基づき算出し、ピッチ抽出論
理回路3に伝達する。
・・・・・・(11
但し、W(k) :窓関数
X(n+k) 、X(n+に+i) :音声n:積分
区間の始点 i:自己相関関数の遅延量 に:積分区間(例えば128) なおj、nおよびkは、何れも標本化周期T(例えば1
25マイクロ秒)を単位とする。
区間の始点 i:自己相関関数の遅延量 に:積分区間(例えば128) なおj、nおよびkは、何れも標本化周期T(例えば1
25マイクロ秒)を単位とする。
また算出対象とする遅延量iの範囲(以後区間と称する
)は、ピンチ周波数領域(通常50ヘルツ乃至500ヘ
ルツ)を充分包含する範囲(例えばi=l乃至192)
に設定する。
)は、ピンチ周波数領域(通常50ヘルツ乃至500ヘ
ルツ)を充分包含する範囲(例えばi=l乃至192)
に設定する。
ピンチ抽出論理回路3は、自己相関関数算出回路2から
伝達された自己相関関数R(i)を、予め定められた基
準値(例えば完全な周期性を有する有声音が示す自己相
関関数値−1と、完全な非周期性を有する無声音が示す
自己相関関数−〇との中間値として0.5に定める)と
比較し、自己相関関数R(i)が基準値(0,5)を上
回れば有声音、下回れば無声音と判定する。
伝達された自己相関関数R(i)を、予め定められた基
準値(例えば完全な周期性を有する有声音が示す自己相
関関数値−1と、完全な非周期性を有する無声音が示す
自己相関関数−〇との中間値として0.5に定める)と
比較し、自己相関関数R(i)が基準値(0,5)を上
回れば有声音、下回れば無声音と判定する。
更にピッチ抽出論理回路3は、有声音と判定された音声
Xに対しては、区間(i−1乃至192)内における自
己相関関数R(i)の極大点の中から最大値R1を有す
る最大点(遅延量mR)を抽出し、対象区間におけるピ
ッチpとする。
Xに対しては、区間(i−1乃至192)内における自
己相関関数R(i)の極大点の中から最大値R1を有す
る最大点(遅延量mR)を抽出し、対象区間におけるピ
ッチpとする。
以上の説明から明らかな如く、従来あるピッチ抽出回路
においては、対象とする音声の自己相関関数R(+)が
基準値を土建る場合に有声音と判定し、有声音と判定さ
れた区間内における自己相関関数R(i)の最大点によ
りピッチpを抽出していた。
においては、対象とする音声の自己相関関数R(+)が
基準値を土建る場合に有声音と判定し、有声音と判定さ
れた区間内における自己相関関数R(i)の最大点によ
りピッチpを抽出していた。
然し有声音も、例えば音韻の変化点では周期性が崩れ、
自己相関関数R(+)が基準値を下回って無声音として
検出される恐れがある。かかる場合を考慮して基準値を
低く設定すると、自己相関関数値の大きい無声音を誤っ
て有声音と判定する恐れがある。
自己相関関数R(+)が基準値を下回って無声音として
検出される恐れがある。かかる場合を考慮して基準値を
低く設定すると、自己相関関数値の大きい無声音を誤っ
て有声音と判定する恐れがある。
また有声音においても、自己相関関数R(+)がピッチ
の二倍に対応する点で最大となる場合、或いはホルマン
トに対応する点で最大となる場合等がある。
の二倍に対応する点で最大となる場合、或いはホルマン
トに対応する点で最大となる場合等がある。
この様な音声から高精度でピンチを抽出する為には、従
来あるピッチ抽出回路では実現困難となる問題点があっ
た。
来あるピッチ抽出回路では実現困難となる問題点があっ
た。
第1図は本発明の原理を示す図である。
第1図において、100は本発明により設けられ、入力
音声の対象区間内における短時間エネルギ関数P (i
)を(2)式に基づいて算出する短時間エネルギ関数算
出手段である。
音声の対象区間内における短時間エネルギ関数P (i
)を(2)式に基づいて算出する短時間エネルギ関数算
出手段である。
200は本発明により設けられ、短時間エネルギ関数算
出手段100で算出された短時間キネルギ関数の対象区
間内における変化状態を、予め定められた形式番ご分類
する発声状態分類手段である。
出手段100で算出された短時間キネルギ関数の対象区
間内における変化状態を、予め定められた形式番ご分類
する発声状態分類手段である。
300は本発明により複数段けられ、発声状態分類手段
200の分類結果に対応して、それぞれ入力音声のピッ
チを抽出するピンチ抽出手段である。
200の分類結果に対応して、それぞれ入力音声のピッ
チを抽出するピンチ抽出手段である。
短時間エネルギ関数P (i)は、入力音声Xのエネル
ギ変動に対応して変動する。従って、一般にエネルギの
小さい無声音からエネルギの大きい有声音への遷移区間
、或いは無声音から有声音への遷移区間においては、短
時間エネルギ関数P(i)も有声音および無声音の定常
区間に比して大きく変動する。
ギ変動に対応して変動する。従って、一般にエネルギの
小さい無声音からエネルギの大きい有声音への遷移区間
、或いは無声音から有声音への遷移区間においては、短
時間エネルギ関数P(i)も有声音および無声音の定常
区間に比して大きく変動する。
本発明はかかる点に着目し、入力音声の対象区間におけ
る短時間エネルギ関数P (+)を算出し、短時間エネ
ルギ関数P (i)の変化状態から予め定められた複数
の形式に分類し、分類された各形式に適したピンチ抽出
論理に基づき、各区間のピンチを抽出する。
る短時間エネルギ関数P (+)を算出し、短時間エネ
ルギ関数P (i)の変化状態から予め定められた複数
の形式に分類し、分類された各形式に適したピンチ抽出
論理に基づき、各区間のピンチを抽出する。
従って、各入力音声の状態に適したピンチ抽出論理が適
用される為、高精度にピンチを抽出可能となる。
用される為、高精度にピンチを抽出可能となる。
以下、本発明の一実施例を図面により説明する。
第2図は本発明の一実施例によるピンチ抽出回路を示す
図であり、第3図は第2図における発声状態の分類過程
を例示する図であり、第4図は遷移区間の説明図であり
、第5図は定常区間におけるピッチ抽出処理過程を例示
する図であり、第6図は遷移区間におけるピンチ抽出処
理過程を例示する図であり、第7図(al乃至第7図t
elおよび第8図[al乃至第8図fdlは第2図の動
作を説明する図である。なお、企図を通じて同一符号は
同一対象物を示す。
図であり、第3図は第2図における発声状態の分類過程
を例示する図であり、第4図は遷移区間の説明図であり
、第5図は定常区間におけるピッチ抽出処理過程を例示
する図であり、第6図は遷移区間におけるピンチ抽出処
理過程を例示する図であり、第7図(al乃至第7図t
elおよび第8図[al乃至第8図fdlは第2図の動
作を説明する図である。なお、企図を通じて同一符号は
同一対象物を示す。
第2図においては、自己相関関数算出回路2゛が短時間
エネルギ関数算出手段100として設けられ、発声状態
検出回路10、スイッチ回路20および30が発声状態
分類手段200として設けられ、ピンチ抽出論理回路4
1.42および43がそれぞれピッチ抽出手段300と
して設けられている。
エネルギ関数算出手段100として設けられ、発声状態
検出回路10、スイッチ回路20および30が発声状態
分類手段200として設けられ、ピンチ抽出論理回路4
1.42および43がそれぞれピッチ抽出手段300と
して設けられている。
第2図において、自己相関関数算出回路2°は、入力端
子1から入力される音声Xに対し、短時間エネルギ関数
P(+)を算出して発声状態検出回路10に伝達し、更
に短時間エネルギ関数P (i)を用いて自己相関関数
R(i)を算出し、スイッチ回路20に伝達する。
子1から入力される音声Xに対し、短時間エネルギ関数
P(+)を算出して発声状態検出回路10に伝達し、更
に短時間エネルギ関数P (i)を用いて自己相関関数
R(i)を算出し、スイッチ回路20に伝達する。
発声状態検出回路10は、受信した短時間エネルギ関数
P (j)が最大値P、を示す遅延量+=m、を検出し
、また対象区間(i−1乃至192)における短時間エ
ネルギ関数P(i)の値を、最大値P6により正規化し
た後、予め定められた基準値(例えば最大値Pイの1/
8)と第3図の過程により比較し、短時間エネルギ関数
P (i)が大きく変化しない定常区間VXO1短時間
エネルギ関数P (i)が遅延量iの増加に伴い減少す
る遷移区間VXI、および短時間エネルギ関数P (i
)が遅延量iの増加に伴い増加する遷移区間VX2に分
類する。
P (j)が最大値P、を示す遅延量+=m、を検出し
、また対象区間(i−1乃至192)における短時間エ
ネルギ関数P(i)の値を、最大値P6により正規化し
た後、予め定められた基準値(例えば最大値Pイの1/
8)と第3図の過程により比較し、短時間エネルギ関数
P (i)が大きく変化しない定常区間VXO1短時間
エネルギ関数P (i)が遅延量iの増加に伴い減少す
る遷移区間VXI、および短時間エネルギ関数P (i
)が遅延量iの増加に伴い増加する遷移区間VX2に分
類する。
先ず発声状態検出回路10は、
条件mp −192(ステップ31)成立条件P (6
4) <0.125 (ステップS2)成立の場合(
第4図(al■)、 条件mp =192 (ステップSl)成立条件P(
64)<0.125 (ステップS2)不成立条件P
(128)≧0.125 (ステップS3)不成立
の場合(第4図Cal■)、または 条件m、 =192 (ステップSl)不成立条件P
C1) <0.125 (ス5−ンプS4)成立条件
P(64)<0.125 (ステップS5)成立の場
合(第4図(bl■)、 区間(I−1乃至192)を遷移区間VX2に分類する
(ステップ5100)。
4) <0.125 (ステップS2)成立の場合(
第4図(al■)、 条件mp =192 (ステップSl)成立条件P(
64)<0.125 (ステップS2)不成立条件P
(128)≧0.125 (ステップS3)不成立
の場合(第4図Cal■)、または 条件m、 =192 (ステップSl)不成立条件P
C1) <0.125 (ス5−ンプS4)成立条件
P(64)<0.125 (ステップS5)成立の場
合(第4図(bl■)、 区間(I−1乃至192)を遷移区間VX2に分類する
(ステップ5100)。
また発声状態検出回路10は、
条件mP =192 (ステップSl)不成立条件P
(1) <0.125 (ステップ34)不成立条件
P (192) ≧0.125 (ステップS6)不
成立条件P(160) ≧0.125 (ステップs
7)不成立の場合(第4図fcl■)、または 条件mP =192 (ステップSl)不成立条件P
(1) <0.125 (ステップS4)不成立条
件P(192) ≧0.125 (ステップS6)ま
たは条件p(16(1) ≧0.125 (ステップ
S7)が成立条件m、≠0 (ステップ38)不成立条
件P(mR) <0.125 (ステップS9)また
は条件P (iL) <0.125 (ステ7プS9
)が成立(但しiLは一区間前に抽出したピッチ)の場
合(第4図(di■または■〉、 区間(i−1乃至192)を遷移区間Vx1に分類する
(ステップ5200)。
(1) <0.125 (ステップ34)不成立条件
P (192) ≧0.125 (ステップS6)不
成立条件P(160) ≧0.125 (ステップs
7)不成立の場合(第4図fcl■)、または 条件mP =192 (ステップSl)不成立条件P
(1) <0.125 (ステップS4)不成立条
件P(192) ≧0.125 (ステップS6)ま
たは条件p(16(1) ≧0.125 (ステップ
S7)が成立条件m、≠0 (ステップ38)不成立条
件P(mR) <0.125 (ステップS9)また
は条件P (iL) <0.125 (ステ7プS9
)が成立(但しiLは一区間前に抽出したピッチ)の場
合(第4図(di■または■〉、 区間(i−1乃至192)を遷移区間Vx1に分類する
(ステップ5200)。
更に遷移区間検出回路40は、
条件rnp =192 (ステップSL)成立条件P
(64)<0.125 (ステップS2)不成立条件
P (128)≧0.125 (ステップS3)成立
の場合、 条件my =192 (ステップ31)不成立条件P
(1) <0.125 (ステップS4)成立条件P
(64)<0.125 (ステップS5)不成立の場
合、 条件m、 −192(ステップ31)不成立条件P(1
) <0.125 (ステップS4)不成立条件P
(192)≧0.125 (ステップS6)または条
件P (160)≧0.125 (ステップS7)が
成立条件mp ≠0 (ステップS8)成立の場合、ま
たは 条件mp =192 (ステップSl)不成立条件P
(1) <0.125 (ステップS4)不成立条件
P (192)≧0.125 (ステップS6)また
は条件P (160)≧0.125 (ステップ37
)が成立条件m、≠0 (ステップS8)不成立条件P
(m、l) <0.125 (ステップS9)不成立
条件P (iL) <0.125 (ステップS9)
不成立の場合、 区間(j=1乃至192)を定常区間VXOと分類する
(ステップ5300)。
(64)<0.125 (ステップS2)不成立条件
P (128)≧0.125 (ステップS3)成立
の場合、 条件my =192 (ステップ31)不成立条件P
(1) <0.125 (ステップS4)成立条件P
(64)<0.125 (ステップS5)不成立の場
合、 条件m、 −192(ステップ31)不成立条件P(1
) <0.125 (ステップS4)不成立条件P
(192)≧0.125 (ステップS6)または条
件P (160)≧0.125 (ステップS7)が
成立条件mp ≠0 (ステップS8)成立の場合、ま
たは 条件mp =192 (ステップSl)不成立条件P
(1) <0.125 (ステップS4)不成立条件
P (192)≧0.125 (ステップS6)また
は条件P (160)≧0.125 (ステップ37
)が成立条件m、≠0 (ステップS8)不成立条件P
(m、l) <0.125 (ステップS9)不成立
条件P (iL) <0.125 (ステップS9)
不成立の場合、 区間(j=1乃至192)を定常区間VXOと分類する
(ステップ5300)。
更に発声状態検出回路10は、分類結果が定常区間VX
Oであった場合には、スイッチ回路20および30をピ
ンチ抽出論理回路41fc選択する如く設定し、また分
類結果が遷移区間VXIであった場合には、スイッチ回
路20および30をピンチ抽出論理回路42を選択する
如く設定し、また分類結果が遷移区間VX2であった場
合には、スイッチ回路20および30をピッチ抽出論理
回路43を選択する如く設定する。
Oであった場合には、スイッチ回路20および30をピ
ンチ抽出論理回路41fc選択する如く設定し、また分
類結果が遷移区間VXIであった場合には、スイッチ回
路20および30をピンチ抽出論理回路42を選択する
如く設定し、また分類結果が遷移区間VX2であった場
合には、スイッチ回路20および30をピッチ抽出論理
回路43を選択する如く設定する。
なお連続する複数区間の発声状態は、次の二種類の何れ
かとなる。
かとなる。
第一に、第一の定常区間VXOから、短時間エネルギ関
数P (+)が次第に増加する遷移区間VX2を経由し
て、第二の定常区間vXOに移行し、更に短時間エネル
ギ関数P (i)が次第に減少する遷移区間VXIを経
由して、第三の定常区間VXOへ移行する。かかる場合
には、第一および第三の定常区間vXOは短時間エネル
ギ関数P (i)が小さい無声音の定常区間であり、第
二の定常区間■XOは短時間エネルギ関数P (i)が
大きい有声音の定常区間と判定される。
数P (+)が次第に増加する遷移区間VX2を経由し
て、第二の定常区間vXOに移行し、更に短時間エネル
ギ関数P (i)が次第に減少する遷移区間VXIを経
由して、第三の定常区間VXOへ移行する。かかる場合
には、第一および第三の定常区間vXOは短時間エネル
ギ関数P (i)が小さい無声音の定常区間であり、第
二の定常区間■XOは短時間エネルギ関数P (i)が
大きい有声音の定常区間と判定される。
第二に、第一の定常区間VXOから、短時間エネルギ関
数P (i)が次第に減少する遷移区間VX1を経由し
て、第二の定常区間VXOに移行し、更に短時間エネル
ギ関数P(+)が次第に増加する遷移区間VX2を経由
して、第三の定常区間VXOへ移行する。かかる場合に
は、第一および第二の定常区間VXOは短時間エネルギ
関数P (+)が大きくそれぞれ音韻の異なる有声音の
定常区間であり、第二の定常区間vXOは短時間エネル
ギ関数P (+)が小さい音韻の変化点における有声音
の定常区間と判定される。
数P (i)が次第に減少する遷移区間VX1を経由し
て、第二の定常区間VXOに移行し、更に短時間エネル
ギ関数P(+)が次第に増加する遷移区間VX2を経由
して、第三の定常区間VXOへ移行する。かかる場合に
は、第一および第二の定常区間VXOは短時間エネルギ
関数P (+)が大きくそれぞれ音韻の異なる有声音の
定常区間であり、第二の定常区間vXOは短時間エネル
ギ関数P (+)が小さい音韻の変化点における有声音
の定常区間と判定される。
ピッチ抽出論理回路41はかかる発声状態を考慮し、対
象区間が定常区間VXOと分類された場合に、自己相関
関数算出回路2°から伝達される自己相関関数R(i)
から、第5図に示される過程でピッチを抽出する。
象区間が定常区間VXOと分類された場合に、自己相関
関数算出回路2°から伝達される自己相関関数R(i)
から、第5図に示される過程でピッチを抽出する。
先ずピンチ抽出論理回路41は、対象区間の前の区間が
無声音か否かを識別しく第5図ステップ521)、前区
間が無声音と識別された場合には(ステップ522)、
対象区間は無声音に続く無声音の定常区間と判定し、ピ
ンチの抽出処理を行わず、対象区間が無声音であるとの
判定結果のみをスイッチ回路30を介して出力端子4か
ら出力する(ステップ527)。
無声音か否かを識別しく第5図ステップ521)、前区
間が無声音と識別された場合には(ステップ522)、
対象区間は無声音に続く無声音の定常区間と判定し、ピ
ンチの抽出処理を行わず、対象区間が無声音であるとの
判定結果のみをスイッチ回路30を介して出力端子4か
ら出力する(ステップ527)。
またステップS21において、前区間が無声音では無い
と識別された場合には(ステップ522)、更に前区間
の発声状態を識別しくステップ523)、前区間が短時
間エネルギ関数P (i)が減少する遷移区間VXIで
は無いと識別された場合には(ステップ324)、対象
区間は有声音の定常区間に続く、または無声音から有声
音への遷移区間に続く有声音の定常区間と判定し、対象
区間における自己相関関数R(i)に対し定常区間に適
したピッチ抽出処理、例えば自己相関関数R(i)の最
大値R1を示す遅延量i=mRをピッチpとして抽出す
る処理を実行し、スイッチ回路30を介して出力端子4
から出力する(ステップ828)。
と識別された場合には(ステップ522)、更に前区間
の発声状態を識別しくステップ523)、前区間が短時
間エネルギ関数P (i)が減少する遷移区間VXIで
は無いと識別された場合には(ステップ324)、対象
区間は有声音の定常区間に続く、または無声音から有声
音への遷移区間に続く有声音の定常区間と判定し、対象
区間における自己相関関数R(i)に対し定常区間に適
したピッチ抽出処理、例えば自己相関関数R(i)の最
大値R1を示す遅延量i=mRをピッチpとして抽出す
る処理を実行し、スイッチ回路30を介して出力端子4
から出力する(ステップ828)。
またステップS24において、前区間が遷移区間VXI
と識別された場合には、対象区間における音声Xが無声
音か否かの検査処理を、例えば対象区間(i−1乃至1
92)における自己相関関数R(i)が0.5未満か否
か、或いは自己相関関数R(i)の最大値R7を示す遅
延量i=m、lが、(3)式から求められる平均自己相
関関数Ra (+)の最長零交差間隔より小さいか否か
を検査する処理を実行する(ステップ525)。
と識別された場合には、対象区間における音声Xが無声
音か否かの検査処理を、例えば対象区間(i−1乃至1
92)における自己相関関数R(i)が0.5未満か否
か、或いは自己相関関数R(i)の最大値R7を示す遅
延量i=m、lが、(3)式から求められる平均自己相
関関数Ra (+)の最長零交差間隔より小さいか否か
を検査する処理を実行する(ステップ525)。
(但しSGN (A):Aの極性)
検査の結果が無声音であれば、対象区間は無声音の定常
区間と判定しくステップ526)、ピンチの抽出処理を
行わず、対象区間が無声音であるとの判定結果のみをス
イッチ回路30を介して出力端子4から出力する(ステ
ップ527)。
区間と判定しくステップ526)、ピンチの抽出処理を
行わず、対象区間が無声音であるとの判定結果のみをス
イッチ回路30を介して出力端子4から出力する(ステ
ップ527)。
またステップS25における検査の結果が無声音で無け
れば、対象区間は有声音の定常区間と判定し、対象区間
における自己相関関数R(i)に対し、前述の如き定常
区間に適したピンチ抽出処理を実行し、スイッチ回路3
0を介して出力端子4から出力する(ステップ828)
。
れば、対象区間は有声音の定常区間と判定し、対象区間
における自己相関関数R(i)に対し、前述の如き定常
区間に適したピンチ抽出処理を実行し、スイッチ回路3
0を介して出力端子4から出力する(ステップ828)
。
次にピッチ抽出論理回路42は、短時間エネルギ関数P
(i)が次第に減少する遷移区間VXIと分類された
場合に、自己相関関数算出回路2′から伝達される自己
相関関数R(i)から、第6図に示される過程でピンチ
を抽出する。
(i)が次第に減少する遷移区間VXIと分類された
場合に、自己相関関数算出回路2′から伝達される自己
相関関数R(i)から、第6図に示される過程でピンチ
を抽出する。
先ずピッチ抽出論理回路42は、対象区間における音声
Xが無声音か否かの検査処理を、ステップS25 (第
5図)におけると同様に実行し、無声音であれば(ステ
ップ532)、ピッチの抽出処理を行わず、対象区間が
無声音であるとの判定結果のみをスイッチ回路30を介
して出力端子4から出力する(ステップ533)。
Xが無声音か否かの検査処理を、ステップS25 (第
5図)におけると同様に実行し、無声音であれば(ステ
ップ532)、ピッチの抽出処理を行わず、対象区間が
無声音であるとの判定結果のみをスイッチ回路30を介
して出力端子4から出力する(ステップ533)。
またステップS32における検査の結果、有声音であれ
ば、対象区間における自己相関関数R(i)に対し遷移
区間に適したピッチ抽出処理、例えば前区間において抽
出されたピッチに最も近い極大点を示す遅延量iを対象
区間におけるピッチとして抽出する処理を実行し、スイ
ッチ回路30を介して出力端子4から出力する(ステッ
プ534)。
ば、対象区間における自己相関関数R(i)に対し遷移
区間に適したピッチ抽出処理、例えば前区間において抽
出されたピッチに最も近い極大点を示す遅延量iを対象
区間におけるピッチとして抽出する処理を実行し、スイ
ッチ回路30を介して出力端子4から出力する(ステッ
プ534)。
次にピンチ抽出論理回路43も、対象区間が短時間エネ
ルギ関数P(i)が次第に増加する遷移区間VX2と分
類された場合に、自己相関関数算出回路21から伝達さ
れる自己相関関数R(i)から、ピッチ抽出論理回路4
2と略同様の過程でピンチを抽出する。
ルギ関数P(i)が次第に増加する遷移区間VX2と分
類された場合に、自己相関関数算出回路21から伝達さ
れる自己相関関数R(i)から、ピッチ抽出論理回路4
2と略同様の過程でピンチを抽出する。
但し短時間エネルギ関数P (i)が次第に増加する遷
移区間VX2に適したピンチ抽出処理は、短時間エネル
ギ関数P (+)が次第に減少する遷移区間VX1に適
したピッチ抽出処理とは別個に設定し得る。
移区間VX2に適したピンチ抽出処理は、短時間エネル
ギ関数P (+)が次第に減少する遷移区間VX1に適
したピッチ抽出処理とは別個に設定し得る。
第7図(al乃至第7図(elは、音声Xに対する連続
する複数区間における短時間エネルギ関数P (i)、
自己相関関数R(i)および平均自己相関関数Ra (
+)を示し、第7図(al、第7図fclおよび第7図
telに示される区間は発声状態検出回路10により定
常区間と判定されてピンチ抽出論理回路41が選択され
、更に第7図(a)および第7図(elに示される区間
は無声音と判定されて判定結果のみが出力され、第7図
(C1に示される区間は有声音と判定されてピッチpが
抽出される。
する複数区間における短時間エネルギ関数P (i)、
自己相関関数R(i)および平均自己相関関数Ra (
+)を示し、第7図(al、第7図fclおよび第7図
telに示される区間は発声状態検出回路10により定
常区間と判定されてピンチ抽出論理回路41が選択され
、更に第7図(a)および第7図(elに示される区間
は無声音と判定されて判定結果のみが出力され、第7図
(C1に示される区間は有声音と判定されてピッチpが
抽出される。
一方第7図(b)に示される区間は遷移区間VX2と判
定されてピンチ抽出論理回路43が選択され、ピッチ抽
出論理回路43により無声音と判定されて判定結果のみ
が出力され、また第7図(d+に示される区間は遷移区
間VXIと判定されてピンチ抽出論理回路42が選択さ
れ、ピッチ抽出論理回路42により有声音と判定されて
ピッチpが抽出される。
定されてピンチ抽出論理回路43が選択され、ピッチ抽
出論理回路43により無声音と判定されて判定結果のみ
が出力され、また第7図(d+に示される区間は遷移区
間VXIと判定されてピンチ抽出論理回路42が選択さ
れ、ピッチ抽出論理回路42により有声音と判定されて
ピッチpが抽出される。
また第8図(al乃至第8図fdlは、他の音声Xに対
する連続する複数の区間における短時間エネルギ関数P
(+)、自己相関関数R(i)および平均自己相関関数
Ra (+)を示し、第8図(alおよび第8図(dl
に示される区間は発声状態検出回路10により定常区間
と判定されてピッチ抽出論理回路41が選択され、ピッ
チ抽出論理回路41により何れも有声音と判定されてピ
ッチpが抽出される。
する連続する複数の区間における短時間エネルギ関数P
(+)、自己相関関数R(i)および平均自己相関関数
Ra (+)を示し、第8図(alおよび第8図(dl
に示される区間は発声状態検出回路10により定常区間
と判定されてピッチ抽出論理回路41が選択され、ピッ
チ抽出論理回路41により何れも有声音と判定されてピ
ッチpが抽出される。
一方第8図中)に示される区間は遷移区間VXIと判定
されてピッチ抽出論理回路42が選択され、ピッチ抽出
論理回路42により有声音と判定されてピッチpが抽出
され、また第8図fc)に示される区間は遷移区間VX
2と判定されてピッチ抽出論理回路43が選択され、ピ
ッチ抽出論理回路43により有声音と判定されてピッチ
pが抽出される。
されてピッチ抽出論理回路42が選択され、ピッチ抽出
論理回路42により有声音と判定されてピッチpが抽出
され、また第8図fc)に示される区間は遷移区間VX
2と判定されてピッチ抽出論理回路43が選択され、ピ
ッチ抽出論理回路43により有声音と判定されてピッチ
pが抽出される。
以上の説明から明らかな如く、本実施例によれば、音声
Xの短時間エネルギ関数P (i)の変化状態から定常
区間■XO1遷移区間VXIおよびVX2を分類し、そ
れぞれに適したピンチ抽出論理回路41乃至43が選択
され、ピッチ抽出処理を実行する為、ピンチの抽出精度
が向上する。
Xの短時間エネルギ関数P (i)の変化状態から定常
区間■XO1遷移区間VXIおよびVX2を分類し、そ
れぞれに適したピンチ抽出論理回路41乃至43が選択
され、ピッチ抽出処理を実行する為、ピンチの抽出精度
が向上する。
なお、第2図乃至第8図はあく迄本発明の一実施例に過
ぎず、例えば発声状態の検出過程、並びに各ピンチ抽出
論理回路41乃至43におけるピッチ抽出過程は図示さ
れるものに限定されることは無く、他に幾多の変形が考
慮されるが、何れの場合にも本発明の効果は変わらない
。
ぎず、例えば発声状態の検出過程、並びに各ピンチ抽出
論理回路41乃至43におけるピッチ抽出過程は図示さ
れるものに限定されることは無く、他に幾多の変形が考
慮されるが、何れの場合にも本発明の効果は変わらない
。
以上、本発明によれば、入力音声の各区間のピッチが、
それぞれ発声状態に適したピンチ抽出論理に基づき抽出
される為、ピンチの抽出処理の精度を向上することが出
来る。
それぞれ発声状態に適したピンチ抽出論理に基づき抽出
される為、ピンチの抽出処理の精度を向上することが出
来る。
第1図は本発明の原理を示す図、第2図は本発明の一実
施例によるピッチ抽出回路を示す図、第3図は第2図に
おける発声状態の分類過程を例示する図、第4図は遷移
区間の説明図、第5図は定常区間におけるピンチ抽出処
理過程を例示する図、第6図は遷移区間におけるピンチ
抽出処理過程を例示する図、第7図fal乃至第7図(
e)および第8図cal乃至第8図(d)は第2図の動
作を説明する図、第9図は従来あるピッチ抽出回路の一
例を示す図である。 図において、1は入力端子、2および2′は自己相関関
数算出回路、3および41乃至43はピッチ抽出論理回
路、4は出力端子、10は発声状態検出回路、20およ
び30はスイッチ回路、100は短時間エネルギ関数算
出手段、200は発声状態分類手段、300はピンチ抽
出手段、を示不発明C?)R硬固 第 1 図 (々ン
(b)(C’) (d)遷移区
間の説明図 定常区間(Zち(Jるピ汗地七処理握程に分 r
ζ7
施例によるピッチ抽出回路を示す図、第3図は第2図に
おける発声状態の分類過程を例示する図、第4図は遷移
区間の説明図、第5図は定常区間におけるピンチ抽出処
理過程を例示する図、第6図は遷移区間におけるピンチ
抽出処理過程を例示する図、第7図fal乃至第7図(
e)および第8図cal乃至第8図(d)は第2図の動
作を説明する図、第9図は従来あるピッチ抽出回路の一
例を示す図である。 図において、1は入力端子、2および2′は自己相関関
数算出回路、3および41乃至43はピッチ抽出論理回
路、4は出力端子、10は発声状態検出回路、20およ
び30はスイッチ回路、100は短時間エネルギ関数算
出手段、200は発声状態分類手段、300はピンチ抽
出手段、を示不発明C?)R硬固 第 1 図 (々ン
(b)(C’) (d)遷移区
間の説明図 定常区間(Zち(Jるピ汗地七処理握程に分 r
ζ7
Claims (1)
- 【特許請求の範囲】 入力音声の対象区間における短時間エネルギ関数を算出
する短時間エネルギ関数算出手段(100)と、 該短時間エネルギ関数算出手段(100)により算出さ
れた短時間キネルギ関数の前記対象区間内における変化
状態を、予め定められた形式に分類する発声状態分類手
段(200)と、 前記発声状態分類手段(200)の分類結果に対応して
、それぞれ前記入力音声のピッチを抽出する複数のピッ
チ抽出手段(300)とを設けることを特徴とするピッ
チ抽出回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30213086A JPS63153599A (ja) | 1986-12-17 | 1986-12-17 | ピツチ抽出回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30213086A JPS63153599A (ja) | 1986-12-17 | 1986-12-17 | ピツチ抽出回路 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63153599A true JPS63153599A (ja) | 1988-06-25 |
Family
ID=17905278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30213086A Pending JPS63153599A (ja) | 1986-12-17 | 1986-12-17 | ピツチ抽出回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63153599A (ja) |
-
1986
- 1986-12-17 JP JP30213086A patent/JPS63153599A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3180655B2 (ja) | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
JP3069531B2 (ja) | 音声認識方法 | |
JP3119510B2 (ja) | 音声認識装置 | |
Hirschberg et al. | Generalizing prosodic prediction of speech recognition errors | |
JP3523382B2 (ja) | 音声認識装置及び音声認識方法 | |
JPS63153599A (ja) | ピツチ抽出回路 | |
JP4604424B2 (ja) | 音声認識装置及び方法、並びにプログラム | |
JP2001083978A (ja) | 音声認識装置 | |
JPH02239290A (ja) | 音声認識装置 | |
JPH1097269A (ja) | 音声検出装置及び方法 | |
JP2760096B2 (ja) | 音声認識方式 | |
JPS59224900A (ja) | 音声認識方法 | |
JP2768938B2 (ja) | パターン比較方法 | |
KR100349656B1 (ko) | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 | |
JPH0682275B2 (ja) | 音声認識装置 | |
JPS6180298A (ja) | 音声認識装置 | |
JPS6136798A (ja) | 音声セグメンテ−シヨン法 | |
Rabiner et al. | Some preliminary experiments in the recognition of connected digits | |
JPS62111295A (ja) | 音声認識装置 | |
JPS62280800A (ja) | 破裂子音識別方式 | |
JPH0534677B2 (ja) | ||
JPS60150098A (ja) | 音声認識装置 | |
JPH02240700A (ja) | 音声処理装置 | |
JPS63191199A (ja) | 有声破裂子音識別装置 |