JPH01134398A - 音声分析装置 - Google Patents

音声分析装置

Info

Publication number
JPH01134398A
JPH01134398A JP62293595A JP29359587A JPH01134398A JP H01134398 A JPH01134398 A JP H01134398A JP 62293595 A JP62293595 A JP 62293595A JP 29359587 A JP29359587 A JP 29359587A JP H01134398 A JPH01134398 A JP H01134398A
Authority
JP
Japan
Prior art keywords
spectral envelope
input
signal
envelope
control signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62293595A
Other languages
English (en)
Inventor
Mikiro Yamaguchi
山口 幹郎
Masao Tanabe
田辺 昌男
Yusuke Tsukahara
祐輔 塚原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP62293595A priority Critical patent/JPH01134398A/ja
Publication of JPH01134398A publication Critical patent/JPH01134398A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力音声信号のスペクトル包絡に基づいて、
当該音声信号を分析する音声分析装置に関する。
(従来の技術) 音声認識装置、聴覚障害者のための発生練習装置、音声
分析合成による通信システムあるいは音声合成装置など
においては、目的とする処理を実現するために、入力音
声信号の分析及びその特徴抽出が必要になる。入力音声
信号の分析は、一般に、その周波数スペクトルに基づ・
いてなされる。
それは、人間の聴覚が音声信号の時間変化波形そのもの
より、むしろ音声信号のスペクトルに対して敏感であり
、同一のスペクトル形状を持った信号を同じ音韻として
認識するという事実によっている。
音声信号は、有声音部分においては、声帯振動によって
駆動される周期的信号としての構造を持つ、その結果、
有声音部分の周波数スペクトルは、線スペクトル的構造
を持つ、一方、無声音部分においては、音声信号は声帯
振動をともなわず、むしろ声道を通過する気流によって
起こされる雑音をその音源としている。その結果、この
無音声部分の周波数スベクI・ルは、線スペクトルのよ
うな周期性を持たない、これに対応して、従来の音声分
析においては、入力音声信号の音源として周期的パルス
発生源を想定する方法と、ノイズ音源を想定する方法が
ある。前者は自己回帰モデル(ARモデル)による音声
分析で良く知られ、後者はケプストラム分析による音声
分析で良く知られている。これらの音声分析によれば・
、入力音声信号のスペクトルから微細な構造を取り除い
たいわゆるスペクトル包絡が得られる。
入力音声信号を、上記のARモデルによる分析方法ある
いはクプスドラム分析方法などの方法で分析し、スペク
トル包絡を求める場合、これらの方法は系の時間的定常
性を仮定しているため、本来的には、時間的に音韻が変
化する場合には、適用できないものである。そこで、こ
れらの分析方法においては、系が大きく変化しないと見
られるような短い時間領域の信号を切り出し、これに端
点の影響が出ないようにハミング窓、パニング窓などの
窓関歌をかけることで、時間的に準定常的な信号を作り
出している。そして、この信号を分析することによって
得られるスペクトル包絡を、上記信号きり切り出し時点
でのスペクトル包絡としている。
なお、上記のスペクトル包絡の時系列を得る分析方法の
ほか、モデルの前提として、系の時間的な変化を仮定し
た非定常な音声信号の分析方法も提案されている。しか
し、この分析方法においても、結果としてスペクトル包
絡の時系列が得られることに変わりはない。
さらに上記の分析方法以外の有力な分析方法として、フ
ィルタバンクによる周波数分析方法がある。この分析方
法は、入力音声信号を多数のそれぞれ異なる中心周波数
を持つバンドパスフィルタに通し、それらのフィルタ出
力をもってスペクトル強度とするものである。この分析
方法の特徴は、例えば、ハードウェア化による実時間処
理の容易さにある。
このように、音声分析においては、入力音声信号のスペ
クトル包絡を求めることが多いが、求めたスペクトル包
絡から最終的に、音声信号を分析する方法としては、そ
の局所的ピーク(以下、ローカルピークと記す)からの
フォルマントの周波数及び幅などを抽出することによっ
て分析するフォルマント分析が知られている。この分析
方法は、母音部がそれぞれ固有のフォルマント周波数及
びフォルマント幅を持ち、かつ子音部では、後続する母
音部へ向かってのフォルマント周波数の変化の様子に各
子音の特徴があるという事実に基づくものである0例え
ば、日本語の5母音(アイウェオ)は、周波数の低い側
から2つのフォルマント周波数Fl、F2で特徴づけら
れ、同性で同年代の人物の音声では、Fl、F2はそれ
ぞれほぼ同じ値となる。したがって、フォルマント周波
数F1、F2を検出することによって、母音を識別する
ことが可能である。
また、フォルマントにこだわらず、スペクトル包絡のロ
ーカルビークを抽出し、その周波数と時間的な遷移に注
目するローカルビークの分析も知られている。この分析
方法は、母音の変化部分や子音部分では、ローカルビー
クの時間的変化に、音韻の特徴が現われていると考えら
れる点に基づいている。
その他、スペクトル包絡の曲線そのものをもって音声信
号の特徴量とし、以降の処理で識別、分類あるいは表示
に用いる方法も提示されている。
以上述べたように、音声信号の分析においては、スペク
トル包絡を抽出することが重要であり、さらに、そのス
ペクトル包絡以外にも、そこから得られるフォルマント
の周波数や幅、さらには、ローカルビークの周波数とそ
の遷移なども音声を特徴づける量として用いられる。
(発明が解決しようとしている問題点)ところで、人間
が音声を発する場合、その音印は声道の共振、半共振特
性によって形成されると考えられている0例えば、共振
周波数はスペクトル包絡上にフォルマントとして現われ
る。したがって、声道構造がほぼ同一の人間同志では、
同一の音韻に対しては、はぼ同様なスペクトルが得られ
る。
ところが、男性と女性、子供と大人のように、声道長が
著しく異なる場合には、共振あるいは反共振の周波数が
ずれるなめ、同一の音韻に対するスペクトル包絡の形が
一致しないことが知られている。したがって、この場合
は、ローカルビークやフォルマントの周波数もずれるこ
とになる。このことは、不特定話者の音声認識や聴覚障
害者用の音声の視覚的表示など、発声者tこよらず、同
一音韻に対しては、同一の結果を抽出することを目的と
した分析には、著しく不都合である。
このような問題を解決する方法としては、従来、多数の
標準パターンを用意する方法と、フォルマント周波数の
比を取る方法が知られている。
前者は、男性、女性、大人、子供などの多数の異なった
人間のスペクトル包絡を標準パターンとして登録してお
き、未知の入カバターンを、それら多数の標準パターン
中の最も類似のものに分類することによって、不特定話
者の入力音声を認識しようとするものである。しかし、
この方法では、任意の人間の入力音声に対応するために
は、非常に多数の標準パターンを用意しておかなければ
ならず、また、それらのパターンの比較に長時間を要す
る欠点がある。また、この方法は、声道長を規格化した
結果を抽出するわけではないので、声道長によらない音
韻の特徴を表示する目的では使用できない。
後者のフォルマント周波数の比を取る方法は、声道長に
よらない母音韻の特徴を抽出する方法としてよく知られ
ている。この方法について、さらに説明を付は加えれば
、まず、スペクトル包絡中のローカルビークのうち、母
音について比較的安定と考えられている第1、第2、第
3のフォルマントの周波数Fl、F2.F3を抽出し、
それらの間の比、例えば、Fl/F3.F2/F3を求
めて、特徴量とするものである。声道長がa倍になれば
、フォルマント周波数は1 / a倍、つまり、Fl/
a、F2/a、F3/aになるが、それらの比は不変で
あるというのが、この方法の根拠である。
この方法は、母音について、第1、第2、第3のフォル
マントが安定に抽出される場合は、良い結果をもたらす
が、安定に抽出されない場合は、分析結果の信顆性が著
しく低下するという問題を有する。また、この方法は、
子音部分には適用できないという欠点がある。つまり、
子音部分では、声道の共振特性であるフォルマントは定
義されず、実際、スペクトル包絡上にも、第1、第2、
第3のフォルマントに対応するローカルと−クが観察さ
れるとは限らないので、Fl、F2.F3を抽出して比
を取ることができないのである。また、子音部分に限ら
ず母音でも、立ち上がり部分や終了部分では、7オルマ
ントが必ずしも安定ではないので、誤ったフォルマント
周波数が抽出されることがある。このような場合は、フ
ォルマント周波数の比が不連続に変化し、全く誤った値
を取ってしまう、したがって、この方法は、音声信号中
の母音部分のうち、安定な部分にしか用いることができ
ず、母音部分の初めや終わりの部分及び子音部分は別の
方法を用いて分析しなくてはならない、しかし、その場
合、母音安定部分とその他の部分では、抽出パラメータ
が異なることになるため、子音部分から母音部分への連
続した変化を記述することができない、つまり、フォル
マント周波数の比を取る方法は、本質的に、定常的な母
音だけしか適用できないものである。
以上述べたように、声道長の異なる不特定話者の声道全
般のスペクトル包絡から、音韻に固有の特徴量を抽出す
る方法は、いまだ見いだされていない。
しかしながら、先願の特願昭61−227286号 に
おいて塚原、益田らにより、音声の周波数スペクトルを
周波数に関して積分して、この積分関数上に上記のスペ
クトル包絡を射影することにより個人の差によらない音
韻固有のパターンが得られるという提案がある0本発明
は、その手法に則り以下の事由を目的とする。
この発明の目的は、発声者の性別、年齢などによる声道
長の違いに左右されることなく音韻に個有のスペクトル
を音声の入力と同時の実時間で簡便なオシロスコープ上
に表示することができる音声分析装置を提供するところ
にある。
(問題点を解決するための手段及び作用)上記目的を達
成するためにこの発明は、入力される第1の制御信号に
したがって、入力音声信号からスペクトル包絡を表すデ
ータを出力するためのスペクトル包絡抽出手段に、入力
される音声信号の高域レベルが低域のレベルに近付くよ
うに高域強調を行なうための高域強調手段と、高域強調
された音声信号を予め決められた複数のチャンネルに分
割し、帯域制限を行うためのバンドパスフィルタ手段と
、前記バンドパスフィルタ手段によって帯域制限された
各チャンネルの音声信号を全波整流するための整流手段
と、前記整流手段によって全波整流された音声信号から
帯域制限されたスペクトル包絡を検出するためのローパ
スフィルタ手段と、および、各チャンネルから出力され
、各チャンネルに対応するスペクトル包絡に関するデー
タを、第1の制御信号に従って、選択的に出力するため
のマルチプレクサ手段でスペクトル包絡を抽出し、その
スペクトル包絡を、その値が適切になるように変換する
ための変換手段に、入力されるスペクトル包絡のデータ
を対数化するための対数化手段に、入力されるスペクト
ル包絡のデータを対数演算するための対数演算手段と、
この対数変換されたスペクトル包絡を積分するための積
分手段に、予め決められた変数として周波数に関して、
入力される第2の制御信号に従って、積分する積分器と
、対数変換されたスペクトル包絡と、積分器によって積
分されたスペクトル包絡を入力し、積分スペクトルに関
するスペクトル包絡を射影するための射影手段として、
X−Y表示モードを有するオシロスコープ表示装置と、
および、前記スペクトル抽出手段に前記第1の制御信号
を出力し、前記積分手段に前記第2の制御信号を出力す
るための制御手段で構成した音声分析装置である。
(実施例) 以下、添付図面を参照して、この発明の一実施例による
音声分析装置について詳細に説明する。
第1図は本実施例の処理を行なうための構成を示すブロ
ック図である。第1図において、スペクトル包絡抽出部
1 は、入力音声信号(Ain)のスペクトル包絡P(
f)を抽出する。ここでスペクトル包絡を抽出する方法
としては、フィルタバンクによるスペクトル包絡抽出方
法を用いている。対数化部2 は、スペクトル包絡抽出
部1で抽出されたスペクトル包絡P (f)の大きさを
対数化する。ここで対数化部2 から出力される対数ス
ペクトル包絡1ogIP(f)Iを得る方法としては、
対数アンプによる対数化方法を用いている。積分部3 
は、対数化部2 から出力される対数スペクトル包絡1
ogIP(f)Iを積分する。この積分部3 は、対数
目盛上の周波数を変数として対数スペクトル包絡log
 IP (f)1を積分する積分器31 を用いている
。射影表示部4 は、対数化部2 から出力される対数
スペクトル包絡logIP(f)lと積分部3 がら出
力される積分結果の供給を受け、対数スペクトル包絡l
 og IP (f)Iを周波数(f)上から積分間数
Lp(f)上に射影し表示する。この射影部4 は、x
−y直交座標のX軸にLp(f)を取り、y軸にlog
IP(f)lをとることにより、入力音声信号(Ain
)の分析結果をオシロスコープ上にパターン化するもの
である。制御部5 は、スペクトル包絡抽出部1 へ入
力される音声信号からスペクトル包絡に関するデータを
選択的に出力させる制御信号Cmpx560  と、積
分部3 の積分器31 を制御する制御信号C5r55
0  を出力するものである。
次に第2図から第6図を参照して、各部の構成を詳細に
説明する。
第2図は、入力音声信号(Ain)からスペクトル包絡
P (f)を抽出するスペクトル包絡抽出部の回路図で
、フィルタバンクによるスペクトル包絡抽出方法を用い
ている。
このフィルタバンク回路は、BUG社製VTAD02型
を使用している。
第2図の構成を詳細に説明する。
入力調整部11 は、マイクアンプ110 と高域強調
アンプ111 で構成されており、マイクアンプ110
 は、マイクロホンから取り込んだ音声入力信号(A 
i n )を増幅し、高域強調アンプ111 は、入力
される音声信号の高域を強調する回路とで構成されてい
る。
分配部12 は、入力調整部11 から出力される信号
を後段のために適当に周波数分割するローパスフィルタ
121 から123 の回路で構成されている。
BPF部13 は、音声の周波数範囲をバンドパスフィ
ルタ1301 から1315 が15個で対数的に等分
割する方法で構成されている。
BPFクロック部14 は、BPF部13 のバンドパ
スフィルタ1301 から1315 の各中心周波数を
対数的に等分割するようなりロック発生回路で構成され
ている。
整流部15 は、BPF部13 の各出力を整流し、そ
の振幅成分だけを取り出す全波整流回路で構成されてい
る。
LPF部16 は、整流部15 からの信号から低周波
成分を取り出すローパスフィルタ1601から1615
 による平滑回路で構成されている。
マルチプレクサ部17 は、LPF部16 の各出力を
制御部5 のマルチプレクサ制御信号Cmpx560 
 により15個の対数分割された周波数帯域のデータを
順次周波数の低いほうから高いほうへ出力させることに
よりスペクトル包絡P(f)を得るマルチプレクサ回路
で構成されている。
第3図は、スペクトル包絡抽出部1 から入力されるス
ペクトル包絡P (f)を対数化する対数化部2 と、
対数化部2 から入力される対数スペクトル包絡1og
IP(f)lを積分する積分部3 と、第1図のブロッ
ク図には示していないが、対数化部2 の出力の対数ス
ペクトル包絡log IP (f)Iと積分部3 の積
分出力LP(f)を補強して出力する出力バッファ部6
 、及び、射影表示部4 のオシロスコープ41 の構
成を示す回路図である。
第3図の構成を詳細に説明する。
対数化部2 は、インターシル社の対数アンプ■CL8
048を使用してスペクトル包絡抽出部1からの周波数
スペクトル包!IP(f)のデータを対数化している。
オペアンプ21 、オペアンプ22 、オペアンプ24
 の各オペアンプは、対数アンプ23 の入力バッファ
と出力バイアスWQu回路を構成する。
積分部3 は、オペアンプ37 とコンデンサ34 で
構成される積分器31 と制御部5 の積分器制御信号
C5r550  のリセット信号556 でコンデンサ
34 に蓄積された電荷をショートして放電させるアナ
ログスイッチ32 と制御部5 の積分器制御信号C5
r550  のセット信号557 で積分器31 への
対数化部2からの対数スペクトルlogIP(f)lの
信号を0N−OFFをするアナログスイッチ33 とオ
ペアンプ35 で構成されている。
出力バッファ部6 は、対数スペクトル包絡lOgIP
(f)Iの信号を補強するオペアンプ61と積分器の積
分出力LP(f)の信号を補強するオペアンプ62 で
構成される。
射影表示部4 は、x−y表示モードを持つオシロスコ
ープ41 を表示装置としてテクトロニクス社製246
5型を使用しており、オシロスコープ41 のチャンネ
ル1にはオペアンプ62 でバッファされた積分器31
の積分出力LP(f)のデータを入力し、チャンネル2
にはオペアンプ61 でバッファされた対数スペクトル
包絡lOgIP(f)Iのデータを入力しx−y表示モ
ードで表示動作をさせる構成となっている。
第4図から第6図までは、制御部5 に関するものであ
るためまとめて構成を詳細に説明していく。
第4図は、制御部5 のマルチプレクサ制御信号Cmp
x560  と積分器制御信号C5r550を生成する
ための構成を示すブロック図である。
このブロック図は、本実施例の時間的なタイミングとし
て、スペクトル包絡を得る時間として600μsec、
m分器31 のリセット時間として11μSecと決め
てあり、このタイミングをIM)12の水晶発振器のク
ロックパルスを基として600μsecで15個の対数
分割された周波数帯域のデータを順次周波数の低いほう
から高いほうへ切り替えて出力するようなマルチプレク
サ制御信号Cmpx560  を繰り返し出力するパル
スを作成することと、これと同期して11.usecの
パルス幅の積分器制御信号C5r550  を600p
secの初めに出力する構成を示している。
第5図は、第4図の制御部5 のブロック図から実際に
マルチプレクサ制御信号Cmpx560と積分器制御信
号C5r550  を生成するタイミングチャートを示
している。
第6図は、第5図のタイミングチャートから作成した制
御回路の回路図を示している。
ここで制御部5 のマルチプレクサ制御信号Cmpx5
60  と積分器制御信号C5r550を作成する課程
を説明する。
まず第4図のブロック図を参照して構成を詳細に説明し
ていく。
1M+z水晶発振クロック501 は、2つに分れて、
まず一方は、10分周されて100kH,クロック50
2 になりさらに4分周されて25 k Hzのクロッ
ク信号503 になりこれをカウンタクロック504 
 とする15進カウンタ505 の各出力がマルチプレ
クサ制御信号Cmpx560となり、カウンタクロック
504 のパルスが15個になると15進カウンタ50
5 をクリアするカウンタクリア507 の信号が作ら
れる。
他の一方は、スタートパルスカウンタクロック511 
を生成するために供給される。
スタートパルスカウンタクロック511 は、25kH
zクロツク503 の反転508 と15進カウンタ5
05の反転509 でスタートパルス窓生成510 を
つくりこれとIMHz水晶発振クロック501 で作ら
れる。
スタートパルスカウンタクロック511 で11進カウ
ンタ512 を駆動しスタートパルス514 を伴る。
スタートパルス514 は、11進カウンタ512 で
スタートパルスカウンタクロック511のパルスが11
発目に作られるカウンタクリア513とスタートパルス
カウンタクロック511で作られる。
スタートパルス514 によって積分器制御信号C5r
550  は作られ、積分器31 を制御するセット5
57 とリセット556が作られる。
次に第5図を参照して構成を詳細に説明していく。
第5図のタイミングチャートの時間軸は、同一ではなく
て3つの時間軸に分けて描いである。これは同一時間軸
のスケールで描くと細かすぎたり大まかに過ぎて波形が
1つしか描けなくて所望のパルスを求める過程が描けな
くなるのを避けるためである。
第5図の上から3本目までのタイングチヤードの時間軸
のスケールは同一で、100 k Hzクロック502
0 の1パルスがl、0psecのスケールで描いであ
る。第5図の上から4本目から15本目までのタイミン
グチャートの時間軸は同一で、カウンタクロック504
0 の1パルスが40pseeのスケールで描いである
。第5図の上から16本目から終わりまでの時間軸は同
一で、IMH2水晶発振クロック5010 の1パルス
が1.usecのスケールで描いである。
まず100に+zクロック5020 は、I M Hz
水晶発振クロック5010 を10分周して作られるが
ここでは同一のスケールでは細かすぎるため示していな
い。
これをさらに4分周すると1パルスが40μsecの2
5 k Hzクロック5030 が得られる。この25
 k Hzクロック5030 のスケールを変えて描い
たカウンタクロック5040 を15進カウンタ505
0 に入力すればマルチプレクサ制御信号Cmpx56
0  として4本の信号が得られる。4本の信号はデジ
タル信号であり4bitの信号と言える、4bitで表
せる数は16である0本実施例においてはスペクトル包
絡に関するデータは15個であるから16の数を表す必
要はなく15までのカウンタで良いため、カウンタクロ
ック5040 のパルスを15まで数えたら15進カウ
ンタをクリアするカウンタクリア5070 を出力する
ようにしマルチプレクサ制御信号Cmpx560  と
して、4本の制御線で第2図のスペクトル包絡抽出部1
 のマルチプレクサ部17 に入力される。
25 k Hzクロック5030を反転した信号である
反転5090 と15進カウンタ505  の4本の出
力を反転した信号である反転5090  とでスタート
パルス窓生成5100 を作る。
ここでスタートパルス窓生成5100 とI M H!
水晶発振クロック5010 でスタートパルスカウンタ
クロック5110を作る。スタートパルスカウンタクロ
ック5110は、11進カウンタ5120 に入力され
、スタートパルスカウンタクロック5110 のパルス
の11発目に出るパルスで11進カウンタをクリアする
カウンタクリア5130 を作る。
カウンタクリア5130 とスタートパルス窓生成51
00 でスタートパルス5140 を作る。
スタートパルス5140 は、積分器制御信号C5r5
50  を作り第3図の積分部3 の積分器31 を制
御するリセット556 の信号と、セット557 の信
号をイ営る。
以上を実際の回路としたものが第6国の回路図であり構
成を詳細に説明する。
まずIMH2水晶発振クロックはインバータ150 に
より反転されるが、反転した信号を基として考えている
ためにこの反転出力がI M Hz水晶発振クロック5
010 と言える。
このインバータ150 の出力は、一方でカウンタ15
1 に入力され10分周され、もう一方で、アンド16
1 に入力される。
カウンタ151 で10分周された出力は、カウンタ1
52 で4分周されカウンタ153 に入力されて、マ
ルチプレクサ制御信号Cmpx560 として出力され
る。
カウンタ153 を15進のカウンタとするために、カ
ウンタ153 の出力をアンド154 に入力しカウン
タ153 をり6リアする。
また、カウンタ152 の出力とカウンタ153の出力
をインバータ155 からインバータ156 で反転し
てナンド159 に入力しスタートパルス窓5100 
を生成する。
インバータ150 の出力とナンド159 の出力をイ
ンバータ157 で反転した信号をアンド161 に入
力しスタートパルスカウンタクロック5110 を作る
アンド161 の出力をカウンタ162 に入力し11
進のカウンタを構成するようにアンド163 とオア1
60 でカウンタ162 をクリアする。
オア160  には、ナンド159 の出力も入力され
てスタートパルス窓生成5100 以外のタイミングで
カウンタ162 が動作しないようにクリアされている
ナンド159 とアンド163 の出力は、Ex−オア
164 に入力されスタートパルスを作る。
Ex−オア164 の出力は、バッファ165からバフ
ァ167 までで適当な時間遅れを与えられる。
この時間遅れは、次のカウンタ168 との同期の関係
で時間調節のために挿入されている。
カウンタ168 は、スタートパルス窓生成5100 
の間だけ有効になるようにインバータ169 の出力で
クリアされている。カウンタ168にバッファ167 
の信号が入力されることにより積分器制御信号C5r5
50  としてカウンタ168 の出力をインバータ1
70 及びバッファ171 を通してそれぞれリセット
信号556、セット信号557 として得ることができ
る。
次に上記の構成の音声分析装置の動作について説明する
本実施例の音声分析装置は、アナログ回路でスペクトル
包絡抽出部1 、対数化部2 と積分部3 を構成して
おり、時間的な制御を制御部5のデジタル回路で行なっ
ている。
アナログ回路は常に動作状態でありアナログ信号データ
が入力されしだい、所定の動作をして出力するようにな
っている。
デジタル回路も常に動作状態でありアナログ信号データ
の入力の有無にかかわらずに動作している。
そのため本実施例の音声分析装置は音声の分析をほぼ実
時間で処理して音韻に固有のパターンをオシロスコープ
上に表示することができる。
以上をさらに詳細に説明する。音声信号が入力される前
に、制御部5 からマルチプレクサ制御信号Cmpx5
60  によりスペクトル包絡抽出部1 のマルチプレ
クサ部17 は、常にスペクトル包絡に関するデータを
出力するように動作している。
対数化部2 は、スペクトル包絡のデータを対数化する
ための動作状態でありデータが入力されるのを待ってい
る状態である。
また積分部3 も同様に制御部5 からの積分器制御信
号C5r550  により常に入力信号のデータの積分
を行なっている動作状態である。
さらに射影表示部4 のオシロスコープ41 もデータ
が入力され表示をする動作待ちの状態にある。
本実施例の音声分析装置は、いわばフリーランをしてい
るリアルタイム音声分析表示装置と言うことができる。
次に音声が入力された場合の動作に対して説明する。
電源を投入し本実施例の音声分析装置がフリーランの状
態になった後、マイクロホン等で音声信号が入力11M
部11  に入力されマイクアンプ110 で増幅され
後段のアナログ回路で取り扱い易い信号レベルに調整さ
れる。
調整された信号は、高域強調アンプ111 に入力され
る。音声信号は、高域になるに従い減衰するので、低域
と大体同じレベルになるように、高域強調アンプ111
 で高域周波数成分を強調して、分配部12 に出力す
る。
分配部12 は、3つの周波数帯域を持つローパスフィ
ルタ群121 がら123 で構成されており、後段の
バンドパスフィルタ群13o1 から1315 に余分
な帯域を持った周波数成分を出力しないようにしである
BPF部13 は、15個のバンドパスフィルタ群13
01  から1315 で構成されている。
15個のバンドパスフィルタ群13o1 から1315
 の中心周波数は、15個で大体音声の周波数範囲をカ
バーするように分割されており、各バンドパスフィルタ
13o1 がら1315 の中心周波数は、対数的に等
分割されるようにBPFクロック部14 のデジタルパ
ルス信号で制御されている。
BPF部13 のバンドパスフィルタ群13o1から1
315 は分配部12 の3つのローパスフィルタ群1
21 がら123  の周波数帯域の範囲の中心周波数
を持つように各々に分けて接続されているため余分な周
波数の成分がバンドパスフィルタ群13o1 から13
15 に入力されることはない。
BPF部13 の15個の出力は、音声信号の各帯域ご
とのスペクトル包絡に関するデータであり、整流部15
 へ出力される。
整流部15 は、各整流器15o1 がら1515 で
スペクトル包絡に関するデータの信号を整流してその振
幅成分だけを取り出しLPF部16へ出力する。
整流された信号は、LPF部16 の各ローパスフィル
タ1601 から1615 により音声のピッチ成分が
取り除がれて音声の緩やかに変化するうねりの成分だけ
が取り出されて後段に出方される。
マルチプレクサ部17 は、制御部5 のマルチプレク
サS御信号Cmpx560  によりスペクトル包絡に
関するデータとして15個のローパスフィルタ群160
1 がら1615 からの出力を順に周波数の低いほう
がら高いほうヘシリアルなデータとして出力する。
マルチプレクサ部17 がらの出力は、対数化部2 で
対数化されるが、まずオペアンプ21 で入力を受ける
これは、本実施例の音声分析装置の構成としてスペクト
ル包絡抽出部1 が1枚の基板であり、対数化部2 と
積分部3 及び制御部5 で1枚の基板とした回路構成
のためにノイズの低減のために信号をオペアンプ21 
の差動入力で受けている。
オペアンプ21 の出力は、オペアンプ22 でバイア
スを与えられ、対数アンプ23 に入力される。オペア
ンプ22のバイアスは、入力ゼロの場合の対数を取ると
マイナス無限大となり、対数アンプの入力としては不都
合であるために極くわずか誤差が出ない程度に与えであ
る。
対数アンプ23 で対数化された信号は、処理を容易に
するためにオペアンプ24 に入力されバイアスを与え
られ信号の極性を反転される。
対数化部2 で対数化された信号は、対数スペクト包絡
1ogIP(f)lとしてオペアンプ24から出力され
る。対数スペクト包絡1oglP(f)1は、積分部3
 に入力され積分される。
まずオペアンプ24の出力は、アナログスイッチ33 
でオペアンプ35 に積分のセット時間の間接続されて
いる。
オペアンプ35 の出力は、出力バッファ部のオペアン
プ61 に入力され、他方は積分器31へ入力される。
オペアンプ24 の出力をオペアンプ61に入力しても
同じであるが本実施例の音声分析装置の場合は上記のよ
うにした。
積分部3 の動作を詳細に説明する。
積分器31 は、リセット信号556 と同期するアナ
ログスイッチ32 でコンデンサ34 に蓄えられた電
荷をショートして放電してリセット状態になりリセット
信号556 の解除と同時にセット信号557 が有効
になって対数スペクト包絡1ogIP(f)lの信号が
オペアンプ24よりアナログスイッチ33 をとおりオ
ペアンプ35 に入力されオペアンプ37 がコンデン
サ34 に電荷をチャージして積分を開始する。
積分の開始と同時に対数スペクト包絡1oglP(f)
1の信号がオペアンプ61 に入力され補強されてオシ
ロスコープ41 のチャンネル2に出力される。
また対数スペクト包絡1ogIP(f)Iを積分した積
分値も積分の開始と同時にオペアンプ37から出力され
オペアンプ62 で補強されてオシロスコープ41 の
チャンネル2に出力される。
ここでオシロスコープの表示をx−y表示モードにして
おけば実時間で入力された音声の音韻に固有のパターン
を目で見ることができる。
(発明の効果) この発明によれば、声道長に影響されることなく、音韻
固有の分析パターンを実時間で得ることができるので、
不特定話者の音声認識など、発生者によらず同一音韻に
対しては同一分析結果を得たい場合に、多大に寄与する
ことができる。
【図面の簡単な説明】
第1図は一実施例の構成を示すブロック図、第2図は一
実施例のスペクトル包絡抽出部の回路図、第3図は一実
施例の対数化部と積分部と出力バッファ部と射影表示部
の回路図、第4図は一実施例の制御部のタイミングを生
成する構成を示すブロック図、第5図は一実施例の制御
部のタイミングを示すタイミングチャート、第6図は一
実施例の制御部の回路図を示す。

Claims (9)

    【特許請求の範囲】
  1. (1)入力される第1の制御信号にしたがつて、入力音
    声信号からスペクトル包絡を表すデータを出力するため
    のスペクトル包絡抽出手段と、前記スペクトル包絡抽出
    手段から入力されるスペクトル包絡を、その値が適切に
    なるように変換するための変換手段と、前記変換手段に
    よって変換されたスペクトル包絡を入力し、入力される
    第2の制御信号に従って、予め決められた変数に関して
    入力スペクトル包絡を積分するための積分手段と、前記
    変換手段によって変換されたスペクトル包絡と、前記積
    分手段によって積分されたスペクトル包絡を入力し、積
    分スペクトルに関するスペクトル包絡を射影するための
    射影手段と、および、前記スペクトル抽出手段に前記第
    1の制御信号を出力し、前記積分手段に前記第2の制御
    信号を出力するための制御手段とを具備することを特徴
    とする音声分析装置。
  2. (2)前記変換手段は、入力されるスペクトル包絡のデ
    ータを対数化するための対数化手段を具備することを特
    徴とする特許請求範囲第1項に記載の音声分析装置。
  3. (3)前記積分手段による積分は、予め決められた変数
    として、周波数に関してなされることを特徴とする特許
    請求の範囲第1項に記載の音声分析装置。
  4. (4)前記スペクトル包絡抽出手段は、入力される音声
    信号の高域レベルが低域のレベルに近付くように高域強
    調を行なうため の高域強調手段と、高域強調された音声信号を予め決め
    られた複数のチャンネルに分割し、帯域制限を行うため
    のバンドパスフィルタ手段と、前記バンドパスフィルタ
    手段によって帯域制限された各チャンネルの音声信号を
    全波整流するための整流手段と、前記整流手段によって
    全波整流された音声信号から帯域制限されたスペクトル
    包絡を検出するためのローパスフィルタ手段と、および
    、力され、各チャンネルに対応するスペクトル包絡に関
    するデータを、前記第1の制御信号に従って、選択的に
    出力するためのマルチプレクサ手段とを具備することを
    特徴とする特許請求の範囲第1項に記載の音声分析装置
  5. (5)前記対数化手段は、入力されるスペクトル包絡の
    データを対数演算するための対数演算手段を具備するこ
    とを特徴とする特許請求の範囲第2項に記載の音声分析
    装置。
  6. (6)前記積分手段による積分は、入力される第2の制
    御信号に従つて、全記変換手段によって変換されたスペ
    クトル包絡を、予め決められた変数として、周波数に関
    して積分する積分器を具備することを特徴とする特許請
    求の範囲第1項に記載の音声分析装置。
  7. (7)前記射影手段は、前記変換手段によって変換され
    たスペクトル包絡と、前記積分手段によつて積分された
    スペクトル包絡を入力し、積分スペクトルに関するスペ
    クトル包絡を表示するための表示手段を具備することを
    特徴とする特許求請の範囲第1項に記載の音声分析装置
  8. (8)前記表示手段は、前記積分スペクトルに関するス
    ペクトル包絡を表示するためのX−Y表示モードを有す
    るオシロスコープ表示手段を具備することを特徴とする
    特許請求の範囲第7項に記載の音声分析装置。
  9. (9)前記オシロスコープ表示手段は、前記積分手段に
    よって積分されたスペクトル包絡を前記オシロスコープ
    表示手段のチャンネル1に入力し、前記変換手段によっ
    て変換されたスペクトル包絡を前記オシロスコープ表示
    手段のチャンネル2に入力し、積分スペクトルに関する
    スペクトル包絡をx−y表示モードで表示することを特
    徴とする特許請求の範囲第8項に記載の音声分析装置。
JP62293595A 1987-11-19 1987-11-19 音声分析装置 Pending JPH01134398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62293595A JPH01134398A (ja) 1987-11-19 1987-11-19 音声分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62293595A JPH01134398A (ja) 1987-11-19 1987-11-19 音声分析装置

Publications (1)

Publication Number Publication Date
JPH01134398A true JPH01134398A (ja) 1989-05-26

Family

ID=17796752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62293595A Pending JPH01134398A (ja) 1987-11-19 1987-11-19 音声分析装置

Country Status (1)

Country Link
JP (1) JPH01134398A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008249755A (ja) * 2007-03-29 2008-10-16 Pioneer Electronic Corp 音楽再生装置、音楽再生方法、及び、プログラムを格納した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008249755A (ja) * 2007-03-29 2008-10-16 Pioneer Electronic Corp 音楽再生装置、音楽再生方法、及び、プログラムを格納した記録媒体

Similar Documents

Publication Publication Date Title
EP0219109B1 (en) Method of analyzing input speech and speech analysis apparatus therefor
US4051331A (en) Speech coding hearing aid system utilizing formant frequency transformation
Schroeder Vocoders: Analysis and synthesis of speech
US4829574A (en) Signal processing
EP0054365B1 (en) Speech recognition systems
US3940565A (en) Time domain speech recognition system
US4817155A (en) Method and apparatus for speech analysis
US3855417A (en) Method and apparatus for phonation analysis lending to valid truth/lie decisions by spectral energy region comparison
US5483617A (en) Elimination of feature distortions caused by analysis of waveforms
Smith A phoneme detector
Wan et al. Automatic piano music transcription using audio‐visual features
JPH01134398A (ja) 音声分析装置
JP2002507776A (ja) 音声信号の過渡現象を解析するための信号処理方法
Holmes Copy synthesis of female speech using the JSRU parallel formant synthesiser.
VH et al. A study on speech recognition technology
CN115862636B (zh) 一种基于语音识别技术的互联网人机验证方法
KR100434723B1 (ko) 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법
Meyer et al. Modelling the perception of simultaneous semi-vowels
JPS6229798B2 (ja)
JPS62174798A (ja) 音声分析装置
Abe et al. Auditory scene analysis based on time‐frequency integration of shared FM and AM (I): Lagrange differential features and frequency‐axis integration
JPS63265300A (ja) 音声の特徴抽出方法
JPS62102297A (ja) 単音節音声認識装置
JPS63106800A (ja) 音響分析器
JPH0690634B2 (ja) 周波数弁別器