JPH117297A

JPH117297A - 音声波形処理装置

Info

Publication number: JPH117297A
Application number: JP17760397A
Authority: JP
Inventors: Norio Akamatsu; 則男赤松
Original assignee: SADO MICHIKO
Current assignee: SADO MICHIKO
Priority date: 1997-06-17
Filing date: 1997-06-17
Publication date: 1999-01-12
Anticipated expiration: 2017-06-17
Also published as: JP3145955B2

Abstract

(57)【要約】【課題】音声波形信号から声帯の振動ピッチに同期す
る音声基本周期信号をリアルタイムで、高速かつ高精度
に得る。【解決手段】音声波形処理装置は、音声波形をマイク
ロフォン２により電圧値として測定する。音声波形に対
応する波形電圧が立ち上がる正の領域の音声波形電圧を
正領域分離器４を用いて取り出し、また、波形電圧が立
ち下がる負の領域の音声波形電圧を負領域分離器５を用
いて取り出す。正の領域の音声波形電圧を線形増幅器７
によって増幅される値よりも大きな値となる非線形増幅
器６を用いて増幅し、増幅された電圧のピーク値をピー
ク電圧保持器８により一定期間だけ保持する。ピーク電
圧が保持された正の領域の音声波形電圧とピーク電圧保
持器８を経由していない負の領域の音声波形電圧を音声
波形合成器９を用いて合成し、合成音声波形電圧に微分
器１０を適用して微分し、声帯振動のピッチに同期する
音声基本周期信号を得る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声波形の基本周
期を演算する処理装置に関する。

【０００２】

【従来の技術】本発明の音声波形処理装置は、音声の基
本周期をリアルタイムに演算するものであるが、本明細
書において、音声の基本周波数は下記の意味で使用す
る。母音（ア、イ、ウ、エ、オ）および半母音や鼻音な
どの子音の一部は、音声波形に周期性がある。この周期
を音声の基本周期あるいはピッチ周期と言う。さらに、
音声の基本周期の逆数を音声の基本周波数と言い、音声
のピッチ周期の逆数をピッチ周波数と言う。成人男子の
基本周波数は１００ヘルツから１５０ヘルツであり、成
人女子の基本周波数は２００ヘルツから３００ヘルツで
あり、子供の基本周波数は２５０ヘルツから４００ヘル
ツである。

【０００３】音声認識および音声合成などの音声処理を
行うためには、音声の基本周期を検出する必要がある。
音声の基本周期は、音声の発生源である声帯振動のピッ
チ周期を音声波形から推定することに相当し、音声信号
処理の基本的な技術であり、多くの研究成果がある。そ
の方法の大部分はディジタル信号処理である。これまで
に開発された音声の基本周波数の検出方法の主なものを
以下に記述する。

【０００４】フーリェ変換を用いて音声の基本周波
数を検出する方法高速フーリェ変換（ＦＦＴ）の演算アルゴリズムは信号
処理においてあまりに有名であり、信号処理の全ての書
物に記載されているので、その詳細は省略する。比較的
短時間の音声波形にＦＦＴ法を適用すると、容易に音声
の基本周波数を検出することが可能であり、従来はこの
方法を基本として少し改良し、ハミングやハニングなど
の窓関数を適用して音声のピッチ周期を算出していた。

【０００５】ケプストラム分析を用いて音声の基本
周波数を検出する方法音声波は音源波と声道のインパルス応答との畳み込みと
して表現される。この関係に離散フーリェ変換の絶対値
の対数演算操作を施し、その逆離散フーリェ変換をケプ
ストラムと呼ぶ。ケプストラム分析を適用して音声の基
本周波数を求めることができる。

【０００６】線形予測分析を用いて音声の基本周波
数を検出する方法音声波形のサンプル時系列から最少２乗法を適用して線
形予測係数を推定し、線形予測係数を用いて音声波形を
表現する。この際に、自己相関法あるいは共分散法を用
いる。さらに、周波数スペクトラムを求めて音声波形の
基本周期を求めることができる。

【０００７】

【発明が解決しようとする課題】音声波形の基本周期を
従来の方法を用いて求めると、次に示す短所がある。従来の信号処理方法はディジタル方式であるので、
音声波をアナログからディジタルに変換する必要があ
り、Ａ／Ｄ変換器を必要とする。従来の信号処理方法は積分あるいは加算演算等を施
すので、音声波形の時間的に初期から基本周期をリアル
タイムで決定することはできない。従来の信号処理方法はディジタル方式であり、音声
の基本周期を求めるための演算時間を必要とするので、
高速なリアルタイム処理には適さない。従来の信号処理技術であるフーリェ変換法、ケプス
トラム分析法および線形予測分析法を適用すると、音声
波形の時系列に加算和を求める演算を必要とするので、
個々の音声信号に対する基本周期を高精度で求めること
はできないし、高速にリアルタイムで基本周期信号を決
定することはできない。すなわち、これらの方法は、全
てディジタル方式であるので、基本周期に同期した信号
の精度が悪い。

【０００８】本発明は、この欠点を解決することを目的
に開発されたものである。本発明の重要な目的は、Ａ／
Ｄ変換器を使用することなく、音声信号をリアルタイム
で処理して、高速かつ高精度に音声基本周期を求めるこ
とができる音声波形処理装置を提供することにある。

【０００９】

【課題を解決するための手段】本発明の音声波形処理装
置は下記の構成で、音声の基本周期を演算する。声帯が
開かれて肺臓から空気が押し出されることにより発生す
る音声波形をマイクロフォン２により電圧値として測定
する。マイクロフォン２で測定された音声波形であっ
て、空気が押し出されることにより発生する音声波形に
対応する波形電圧が立ち上がる正のピーク電圧の値が存
在する正の領域の音声波形電圧を、正領域分離器４を用
いて取り出す。正の領域の音声波形電圧が大きい値にお
いて線形増幅器７によって増幅される値よりも大きな値
となる非線形増幅器６を用いて増幅する。さらに非線形
増幅器６によって増幅された電圧のピーク値をピーク電
圧保持器８により一定の期間だけ保持する。上記の音声
波形に対応する波形電圧が立ち下がる負のピーク電圧の
値が存在する負の領域の音声波形電圧を負領域分離器５
を用いて取り出す。ピーク電圧が保持された上記の正の
領域の音声波形電圧と、ピーク電圧保持器８を経由して
いない負の領域の音声波形電圧を音声波形合成器９を用
いて合成する。合成音声波形電圧に微分器１０を適用し
て微分して、声帯振動のピッチに同期する音声基本周期
信号を得る。

【００１０】音声波形の基本周期を従来の装置で演算す
ると、前述に示す短所があるので、それらを本発明の方
法によって解決する。従来の信号処理方法はディジタル方式であるので、
音声波をアナログからディジタルに変換する必要があ
り、Ａ／Ｄ変換器を必要とする。しかし、Ａ／Ｄ変換器
は高価であり、超高速変換が困難であるので、本発明の
音声波形処理装置は、Ａ／Ｄ変換器を用いずに直接的に
アナログの音声波形に音声波形の基本周期検出法を適用
する。

【００１１】従来の信号処理方法は数値積分あるい
は数値加算演算等を施すので、音声波形の時系列の初期
から基本周期に同期した信号を設定することはできな
い。しかし、本発明の音声波形処理装置は、直接的にア
ナログの音声波形に非線形演算回路および微分回路など
を適用して音声波形の基本周期を高精度かつ高速に検出
する。

【００１２】従来の信号処理方法はディジタル方式
であり、基本周期を求めるための演算時間を必要とする
ので、リアルタイム処理には適さない。しかし、本発明
の音声波形処理装置は、直接的にアナログの音声波形に
非線形演算回路および微分回路などを適用して音声波形
の基本周期を求めるので、リアルタイム処理が可能にな
る。

【００１３】従来の信号処理方法はディジタル方式
であるので、基本周期に同期した信号の精度が悪い。し
かし、本発明の音声波形処理装置は、直接的にアナログ
の音声波形に非線形演算回路および微分回路などを適用
して音声波形の基本周期を求めるので、基本周期に同期
した信号の精度は良好である。

【００１４】

【発明の実施の形態】以下、本発明の実施例を図面に基
づいて説明する。ただし、以下に示す実施例は、本発明
の技術思想を具体化するための音声波形処理装置を例示
するものであって、本発明は音声波形処理装置を下記の
ものに特定しない。

【００１５】さらに、この明細書は、特許請求の範囲を
理解し易いように、実施例に示される部材に対応する番
号を、「特許請求の範囲の欄」、および「課題を解決す
るための手段の欄」に示される部材に付記している。た
だ、特許請求の範囲に示される部材を、実施例の部材に
特定するものでは決してない。

【００１６】本発明の音声波形処理装置を構成実施例で
ある図１を用いて説明する。図１において、声帯が開放
されて肺臓から空気が押し出されることにより発生する
音声１をマイクロフォン２により電圧信号に変換するこ
とにより採取し、採取した小さな信号レベルを、線形増
幅器３を適用して大きなレベルに増幅する。線形増幅器
３の構成例を図２に示し、線形増幅器の特性例を図３に
示す。線形増幅器３はオペレーショナル・アンプと呼ば
れるアナログの演算増幅器と入力抵抗Ｒ１およびフィー
ドバック抵抗Ｒ２により構成される。線形増幅器の特性
例は、図３に示すように、入力と出力の関係が直線的な
線形関数で表現される。

【００１７】さらに、上記の増幅された音声波形を正領
域と負領域に分割する。ここに、音声波形の正領域と
は、上記の空気が押し出されることにより発生する音声
波形に対応する波形電圧が立ち上がる正のピーク電圧の
値が存在する正の領域の音声波形である。音声波形の負
領域とは、上記の空気が押し出された後に音声波形電圧
が立ち下がる負のピーク電圧の値が存在する負の領域の
音声波形である。

【００１８】音声波形電圧に正領域分離器４を適用し
て、正領域の音声波形を取り出す。正領域分離器４を構
成するための実施回路例を図４に示す。図４に示す正領
域分離器４には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が負の場合には
出力電圧が正になり、ダイオードＤ２が導通して出力電
圧は零になる。入力電圧が正の場合には出力電圧が負に
なり、ダイオードＤ１が導通して通常の線形増幅器とな
り、正の入力電圧に比例した出力電圧が得られる。

【００１９】音声波形電圧に負領域分離器５を適用し
て、負領域の音声波形を取り出す。負領域分離器５を構
成するための実施回路例を図５に示す。図５に示す負領
域分離器５には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が正の場合には
出力電圧が負になり、ダイオードＤ４が導通して出力電
圧は零になる。入力電圧が負の場合には出力電圧が正に
なり、ダイオードＤ３が導通して通常の線形増幅器とな
り、負の入力電圧に比例した出力電圧が得られる。負領
域分離器５の特性を図６に示す。音声波形の負領域のみ
が出力されており、正領域の音声信号の出力は零であ
る。なお、正領域分離器４の特性を図示していないが、
これは負領域分離器５の特性の符号を変えたものであ
り、正領域分離器４の特性は音声波形の正領域のみが出
力されて、負領域の音声信号の出力は零である。

【００２０】つぎに、上記の正領域の音声波形電圧に非
線形増幅器６を適用して増幅する。ここに、非線形増幅
器６の構成の実施例を図７に示す。さらに、非線形増幅
器６の特性を図８に示す。すなわち、増幅器の入力と出
力の関係が直線的でない増幅器を非線形増幅器と言う。
線形増幅器においては、その出力電圧は入力電圧に比例
するが、非線形増幅器においては、その出力電圧は入力
電圧に比例しない。この場合の非線形性はダイオードな
どの非線形素子によって実現される。

【００２１】さらに、上記の負領域の音声波形電圧に線
形増幅器７を適用して増幅する。ここに、線形増幅器７
の構成の実施例は図２に示した回路と同じであり、線形
増幅器７の特性は図３に示したものと同じであるので、
ここには省略する。すなわち、増幅器の入力と出力の関
係が直線的である増幅器を線形増幅器と言う。線形増幅
器においては、その出力電圧は入力電圧に比例する。

【００２２】つぎに、上記の正領域の音声波形電圧に非
線形増幅器６を適用して増幅された音声波形にピーク電
圧保持器８を適用して、電圧の正のピーク値を一定の期
間だけ保持する。ここに、ピーク電圧保持器の具体的な
回路例を図９に示す。ダイオードＤ９を通過した正の信
号電圧のピーク値がキャパシタＣ１によって保持され
る。同図の演算増幅器とフィードバック回路により入力
信号電圧が良好に保持されてピーク電圧保持器８を構成
する。保持されたピーク電圧を抵抗Ｒ13により減衰させ
る。このときの時定数＝ＲＣを最適値に実験的に定め
る。ここに、抵抗Ｒ13の代わりに可変抵抗素子であるト
ランジスタやＦＥＴを用いて、初期にはこれらの可変抵
抗素子を高抵抗となるように制御してピーク電圧を保持
し、一定の期間後に可変抵抗素子であるトランジスタや
ＦＥＴを低抵抗となるように制御して、保持されたピー
ク電圧を強制的に減衰させる方法も本発明の範囲内であ
る。ピーク電圧保持器８からの出力波形を正領域の処理
済み波形電圧と言う。

【００２３】つぎに、上記の音声波形に対応する波形電
圧が立ち下がる負のピーク電圧の値が存在する負の領域
の音声波形電圧を負領域分離器５を用いて取り出し、こ
の波形に線形増幅器７を適用した出力波形を負領域の処
理済み波形電圧と言う。

【００２４】さらに、ピーク電圧が保持された上記の正
領域の処理済み波形電圧とピーク電圧保持器を経由して
いない上記の負領域の処理済み波形電圧を音声波形合成
器９を用いて合成する。音声波形合成器９の具体的な回
路例を図１０に示す。音声波形合成器９は線形素子であ
る２個の入力抵抗Ｒ14、Ｒ15とオペレーショナル・アン
プとよばれているアナログの演算増幅器およびフィード
バック抵抗Ｒ16を組み合わせて構成され、いわゆる、ア
ナログの加算器と同様な回路である。音声波形合成器９
の出力波形を正負合成波形電圧と言う。

【００２５】さらに、上記の正負合成波形電圧に微分器
１０を適用して微分波形電圧１１を構成することによ
り、音声波形から声帯の振動ピッチに同期する音声基本
周期信号を得る。微分器１０の構成の具体的な回路例を
図１１に示す。図１１に示す微分器１０は線形増幅器の
入力抵抗をキャパシタＣ２に入れ換える事により構成さ
れる。微分器１０は音声波形を微分して充分な大きさま
で増幅する。

【００２６】以上に記述した工程を経由することにより
得られた音声基本周期検出の具体例とマイクロフォンに
より採取され線形増幅器により増幅された源音声信号を
図１２に示す。図１２において、上段は音声波形の源信
号であり、母音の「ア」を示し、下段は本発明の音声波
形処理装置を適用して得られた音声の基本周期信号であ
る。縦線は、得られた音声の基本周期信号の立ち上がり
に引いたものであり、極めて高精度に音声の基本周期が
検出されていることを示す。

【００２７】音声基本周期検出の具体例とマイクロフォ
ンにより採取され線形増幅器により増幅された源音声信
号を拡大して図１３に示す。図１３において、上段は音
声波形の源信号の拡大表示であり、母音の「ア」を示
し、下段は本発明の音声波形処理装置を適用して得られ
た音声の基本周期信号の拡大表示である。縦線は、得ら
れた音声の基本周期信号の立ち上がりに引いたものであ
り、極めて高精度に音声の基本周期が検出されているこ
とを示す。

【００２８】本発明の音声波形処理装置を適用すること
により、音声の基本周期がリアルタイムで、しかも高精
度に検出することが可能になる。音声の基本周期がリア
ルタイムに、しかも高精度に検出することが可能になる
と、音声認識、音声合成などの音声情報処理が容易にな
る。なお、音声波形の基本周期を検出するためには、前
述の処理工程を必要とするが、これらの工程の順序を少
し入れ換えても本発明と同様な結果が得られる可能性は
あるが、それらは本質的に本発明の処理と同様であり、
当然のことであるが、本発明の範囲内にあるものとす
る。

【００２９】

【発明の効果】本発明の音声波形処理装置は、音声のリ
アルタイム処理が可能になり、高速かつ高精度に基本周
期を求めることができる。それは、本発明の音声波形処
理装置が、音声信号をＡ／Ｄコンバータでデジタル信号
に変換して、マイクロコンピューターなどで演算して基
本周期を求めるのではなくて、音声信号をアナログ回路
でリアルタイムに処理して、基本周期を求められるから
である。このような優れた特性の音声波形処理装置を利
用すると、音声の合成、音声の認識および音声情報処理
技術が飛躍的に向上して、コンピュータの入出力に音声
を利用する事が可能になる。さらに、マルチメディアに
おいて重要な役割を示す音声の加工が容易になり、音声
認識、音声圧縮、音声合成、音声再生、音声収録などの
分野において本発明の音声基本周期検出装置を用いるこ
とが可能になる。

【図面の簡単な説明】

【図１】本発明の実施例の音声波形処理装置の構成図

【図２】線形増幅器の構成例を示す回路図

【図３】線形増幅器の特性を示すグラフ

【図４】正領域分離器の構成例を示す回路図

【図５】負領域分離器の構成を示す回路図

【図６】負領域分離器の特性を示すグラフ

【図７】非線形増幅器の構成例を示す回路図

【図８】非線形増幅器の特性を示すグラフ

【図９】ピーク電圧保持器の構成例を示す回路図

【図１０】音声波形合成器の構成例を示す回路図

【図１１】微分器の構成例を示す回路図

【図１２】音声波形と音声基本周期検出の具体例を示す
図

【図１３】音声波形と音声基本周期検出の具体例を示す
拡大図

【符号の説明】

１…音声２…マイクロフォン３…線形増幅器４…正領域分離器５…負領域分離器６…非線形増幅器７…線形増幅器８…ピーク電圧保持器９…音声波形合成器１０…微分器１１…微分波形電圧

Claims

【特許請求の範囲】

【請求項１】声帯が開かれて肺臓から空気が押し出さ
れることにより発生する音声波形をマイクロフォン(2)
により電圧値として測定し、上記の空気が押し出される
ことにより発生する音声波形に対応する波形電圧が立ち
上がる正のピーク電圧の値が存在する正の領域の音声波
形電圧を正領域分離器(4)を用いて取り出し、上記の正
の領域の音声波形電圧が大きい値において線形増幅器
(7)によって増幅される値よりも大きな値となる非線形
増幅器(6)を用いて増幅し、さらに上記の非線形増幅器
(6)によって増幅された電圧のピーク値をピーク電圧保
持器(8)により一定の期間だけ保持し、上記の音声波形
に対応する波形電圧が立ち下がる負のピーク電圧の値が
存在する負の領域の音声波形電圧を負領域分離器(5)を
用いて取り出し、ピーク電圧が保持された上記の正の領
域の音声波形電圧とピーク電圧保持器(8)を経由してい
ない上記の負の領域の音声波形電圧を音声波形合成器
(9)を用いて合成し、上記の合成音声波形電圧に微分器
(10)を適用して微分波形電圧(11)を構成することにより
音声波形から声帯振動のピッチに同期する音声基本周期
信号を得る音声波形処理装置。
【請求項２】ピーク電圧保持器(8)が、ピーク値を減
衰させながら保持する請求項１に記載される音声波形処
理装置。