JPH117297A - 音声波形処理装置 - Google Patents

音声波形処理装置

Info

Publication number
JPH117297A
JPH117297A JP17760397A JP17760397A JPH117297A JP H117297 A JPH117297 A JP H117297A JP 17760397 A JP17760397 A JP 17760397A JP 17760397 A JP17760397 A JP 17760397A JP H117297 A JPH117297 A JP H117297A
Authority
JP
Japan
Prior art keywords
voltage
waveform
voice
peak
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17760397A
Other languages
English (en)
Other versions
JP3145955B2 (ja
Inventor
Norio Akamatsu
則男 赤松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SADO MICHIKO
Original Assignee
SADO MICHIKO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SADO MICHIKO filed Critical SADO MICHIKO
Priority to JP17760397A priority Critical patent/JP3145955B2/ja
Publication of JPH117297A publication Critical patent/JPH117297A/ja
Application granted granted Critical
Publication of JP3145955B2 publication Critical patent/JP3145955B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 音声波形信号から声帯の振動ピッチに同期す
る音声基本周期信号をリアルタイムで、高速かつ高精度
に得る。 【解決手段】 音声波形処理装置は、音声波形をマイク
ロフォン2により電圧値として測定する。音声波形に対
応する波形電圧が立ち上がる正の領域の音声波形電圧を
正領域分離器4を用いて取り出し、また、波形電圧が立
ち下がる負の領域の音声波形電圧を負領域分離器5を用
いて取り出す。正の領域の音声波形電圧を線形増幅器7
によって増幅される値よりも大きな値となる非線形増幅
器6を用いて増幅し、増幅された電圧のピーク値をピー
ク電圧保持器8により一定期間だけ保持する。ピーク電
圧が保持された正の領域の音声波形電圧とピーク電圧保
持器8を経由していない負の領域の音声波形電圧を音声
波形合成器9を用いて合成し、合成音声波形電圧に微分
器10を適用して微分し、声帯振動のピッチに同期する
音声基本周期信号を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声波形の基本周
期を演算する処理装置に関する。
【0002】
【従来の技術】本発明の音声波形処理装置は、音声の基
本周期をリアルタイムに演算するものであるが、本明細
書において、音声の基本周波数は下記の意味で使用す
る。母音(ア、イ、ウ、エ、オ)および半母音や鼻音な
どの子音の一部は、音声波形に周期性がある。この周期
を音声の基本周期あるいはピッチ周期と言う。さらに、
音声の基本周期の逆数を音声の基本周波数と言い、音声
のピッチ周期の逆数をピッチ周波数と言う。成人男子の
基本周波数は100ヘルツから150ヘルツであり、成
人女子の基本周波数は200ヘルツから300ヘルツで
あり、子供の基本周波数は250ヘルツから400ヘル
ツである。
【0003】音声認識および音声合成などの音声処理を
行うためには、音声の基本周期を検出する必要がある。
音声の基本周期は、音声の発生源である声帯振動のピッ
チ周期を音声波形から推定することに相当し、音声信号
処理の基本的な技術であり、多くの研究成果がある。そ
の方法の大部分はディジタル信号処理である。これまで
に開発された音声の基本周波数の検出方法の主なものを
以下に記述する。
【0004】 フーリェ変換を用いて音声の基本周波
数を検出する方法 高速フーリェ変換(FFT)の演算アルゴリズムは信号
処理においてあまりに有名であり、信号処理の全ての書
物に記載されているので、その詳細は省略する。比較的
短時間の音声波形にFFT法を適用すると、容易に音声
の基本周波数を検出することが可能であり、従来はこの
方法を基本として少し改良し、ハミングやハニングなど
の窓関数を適用して音声のピッチ周期を算出していた。
【0005】 ケプストラム分析を用いて音声の基本
周波数を検出する方法 音声波は音源波と声道のインパルス応答との畳み込みと
して表現される。この関係に離散フーリェ変換の絶対値
の対数演算操作を施し、その逆離散フーリェ変換をケプ
ストラムと呼ぶ。ケプストラム分析を適用して音声の基
本周波数を求めることができる。
【0006】 線形予測分析を用いて音声の基本周波
数を検出する方法 音声波形のサンプル時系列から最少2乗法を適用して線
形予測係数を推定し、線形予測係数を用いて音声波形を
表現する。この際に、自己相関法あるいは共分散法を用
いる。さらに、周波数スペクトラムを求めて音声波形の
基本周期を求めることができる。
【0007】
【発明が解決しようとする課題】音声波形の基本周期を
従来の方法を用いて求めると、次に示す短所がある。 従来の信号処理方法はディジタル方式であるので、
音声波をアナログからディジタルに変換する必要があ
り、A/D変換器を必要とする。 従来の信号処理方法は積分あるいは加算演算等を施
すので、音声波形の時間的に初期から基本周期をリアル
タイムで決定することはできない。 従来の信号処理方法はディジタル方式であり、音声
の基本周期を求めるための演算時間を必要とするので、
高速なリアルタイム処理には適さない。 従来の信号処理技術であるフーリェ変換法、ケプス
トラム分析法および線形予測分析法を適用すると、音声
波形の時系列に加算和を求める演算を必要とするので、
個々の音声信号に対する基本周期を高精度で求めること
はできないし、高速にリアルタイムで基本周期信号を決
定することはできない。すなわち、これらの方法は、全
てディジタル方式であるので、基本周期に同期した信号
の精度が悪い。
【0008】本発明は、この欠点を解決することを目的
に開発されたものである。本発明の重要な目的は、A/
D変換器を使用することなく、音声信号をリアルタイム
で処理して、高速かつ高精度に音声基本周期を求めるこ
とができる音声波形処理装置を提供することにある。
【0009】
【課題を解決するための手段】本発明の音声波形処理装
置は下記の構成で、音声の基本周期を演算する。声帯が
開かれて肺臓から空気が押し出されることにより発生す
る音声波形をマイクロフォン2により電圧値として測定
する。マイクロフォン2で測定された音声波形であっ
て、空気が押し出されることにより発生する音声波形に
対応する波形電圧が立ち上がる正のピーク電圧の値が存
在する正の領域の音声波形電圧を、正領域分離器4を用
いて取り出す。正の領域の音声波形電圧が大きい値にお
いて線形増幅器7によって増幅される値よりも大きな値
となる非線形増幅器6を用いて増幅する。さらに非線形
増幅器6によって増幅された電圧のピーク値をピーク電
圧保持器8により一定の期間だけ保持する。上記の音声
波形に対応する波形電圧が立ち下がる負のピーク電圧の
値が存在する負の領域の音声波形電圧を負領域分離器5
を用いて取り出す。ピーク電圧が保持された上記の正の
領域の音声波形電圧と、ピーク電圧保持器8を経由して
いない負の領域の音声波形電圧を音声波形合成器9を用
いて合成する。合成音声波形電圧に微分器10を適用し
て微分して、声帯振動のピッチに同期する音声基本周期
信号を得る。
【0010】音声波形の基本周期を従来の装置で演算す
ると、前述に示す短所があるので、それらを本発明の方
法によって解決する。 従来の信号処理方法はディジタル方式であるので、
音声波をアナログからディジタルに変換する必要があ
り、A/D変換器を必要とする。しかし、A/D変換器
は高価であり、超高速変換が困難であるので、本発明の
音声波形処理装置は、A/D変換器を用いずに直接的に
アナログの音声波形に音声波形の基本周期検出法を適用
する。
【0011】 従来の信号処理方法は数値積分あるい
は数値加算演算等を施すので、音声波形の時系列の初期
から基本周期に同期した信号を設定することはできな
い。しかし、本発明の音声波形処理装置は、直接的にア
ナログの音声波形に非線形演算回路および微分回路など
を適用して音声波形の基本周期を高精度かつ高速に検出
する。
【0012】 従来の信号処理方法はディジタル方式
であり、基本周期を求めるための演算時間を必要とする
ので、リアルタイム処理には適さない。しかし、本発明
の音声波形処理装置は、直接的にアナログの音声波形に
非線形演算回路および微分回路などを適用して音声波形
の基本周期を求めるので、リアルタイム処理が可能にな
る。
【0013】 従来の信号処理方法はディジタル方式
であるので、基本周期に同期した信号の精度が悪い。し
かし、本発明の音声波形処理装置は、直接的にアナログ
の音声波形に非線形演算回路および微分回路などを適用
して音声波形の基本周期を求めるので、基本周期に同期
した信号の精度は良好である。
【0014】
【発明の実施の形態】以下、本発明の実施例を図面に基
づいて説明する。ただし、以下に示す実施例は、本発明
の技術思想を具体化するための音声波形処理装置を例示
するものであって、本発明は音声波形処理装置を下記の
ものに特定しない。
【0015】さらに、この明細書は、特許請求の範囲を
理解し易いように、実施例に示される部材に対応する番
号を、「特許請求の範囲の欄」、および「課題を解決す
るための手段の欄」に示される部材に付記している。た
だ、特許請求の範囲に示される部材を、実施例の部材に
特定するものでは決してない。
【0016】本発明の音声波形処理装置を構成実施例で
ある図1を用いて説明する。図1において、声帯が開放
されて肺臓から空気が押し出されることにより発生する
音声1をマイクロフォン2により電圧信号に変換するこ
とにより採取し、採取した小さな信号レベルを、線形増
幅器3を適用して大きなレベルに増幅する。線形増幅器
3の構成例を図2に示し、線形増幅器の特性例を図3に
示す。線形増幅器3はオペレーショナル・アンプと呼ば
れるアナログの演算増幅器と入力抵抗R1およびフィー
ドバック抵抗R2により構成される。線形増幅器の特性
例は、図3に示すように、入力と出力の関係が直線的な
線形関数で表現される。
【0017】さらに、上記の増幅された音声波形を正領
域と負領域に分割する。ここに、音声波形の正領域と
は、上記の空気が押し出されることにより発生する音声
波形に対応する波形電圧が立ち上がる正のピーク電圧の
値が存在する正の領域の音声波形である。音声波形の負
領域とは、上記の空気が押し出された後に音声波形電圧
が立ち下がる負のピーク電圧の値が存在する負の領域の
音声波形である。
【0018】音声波形電圧に正領域分離器4を適用し
て、正領域の音声波形を取り出す。正領域分離器4を構
成するための実施回路例を図4に示す。図4に示す正領
域分離器4には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が負の場合には
出力電圧が正になり、ダイオードD2が導通して出力電
圧は零になる。入力電圧が正の場合には出力電圧が負に
なり、ダイオードD1が導通して通常の線形増幅器とな
り、正の入力電圧に比例した出力電圧が得られる。
【0019】音声波形電圧に負領域分離器5を適用し
て、負領域の音声波形を取り出す。負領域分離器5を構
成するための実施回路例を図5に示す。図5に示す負領
域分離器5には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が正の場合には
出力電圧が負になり、ダイオードD4が導通して出力電
圧は零になる。入力電圧が負の場合には出力電圧が正に
なり、ダイオードD3が導通して通常の線形増幅器とな
り、負の入力電圧に比例した出力電圧が得られる。負領
域分離器5の特性を図6に示す。音声波形の負領域のみ
が出力されており、正領域の音声信号の出力は零であ
る。なお、正領域分離器4の特性を図示していないが、
これは負領域分離器5の特性の符号を変えたものであ
り、正領域分離器4の特性は音声波形の正領域のみが出
力されて、負領域の音声信号の出力は零である。
【0020】つぎに、上記の正領域の音声波形電圧に非
線形増幅器6を適用して増幅する。ここに、非線形増幅
器6の構成の実施例を図7に示す。さらに、非線形増幅
器6の特性を図8に示す。すなわち、増幅器の入力と出
力の関係が直線的でない増幅器を非線形増幅器と言う。
線形増幅器においては、その出力電圧は入力電圧に比例
するが、非線形増幅器においては、その出力電圧は入力
電圧に比例しない。この場合の非線形性はダイオードな
どの非線形素子によって実現される。
【0021】さらに、上記の負領域の音声波形電圧に線
形増幅器7を適用して増幅する。ここに、線形増幅器7
の構成の実施例は図2に示した回路と同じであり、線形
増幅器7の特性は図3に示したものと同じであるので、
ここには省略する。すなわち、増幅器の入力と出力の関
係が直線的である増幅器を線形増幅器と言う。線形増幅
器においては、その出力電圧は入力電圧に比例する。
【0022】つぎに、上記の正領域の音声波形電圧に非
線形増幅器6を適用して増幅された音声波形にピーク電
圧保持器8を適用して、電圧の正のピーク値を一定の期
間だけ保持する。ここに、ピーク電圧保持器の具体的な
回路例を図9に示す。ダイオードD9を通過した正の信
号電圧のピーク値がキャパシタC1によって保持され
る。同図の演算増幅器とフィードバック回路により入力
信号電圧が良好に保持されてピーク電圧保持器8を構成
する。保持されたピーク電圧を抵抗R13により減衰させ
る。このときの時定数=RCを最適値に実験的に定め
る。ここに、抵抗R13の代わりに可変抵抗素子であるト
ランジスタやFETを用いて、初期にはこれらの可変抵
抗素子を高抵抗となるように制御してピーク電圧を保持
し、一定の期間後に可変抵抗素子であるトランジスタや
FETを低抵抗となるように制御して、保持されたピー
ク電圧を強制的に減衰させる方法も本発明の範囲内であ
る。ピーク電圧保持器8からの出力波形を正領域の処理
済み波形電圧と言う。
【0023】つぎに、上記の音声波形に対応する波形電
圧が立ち下がる負のピーク電圧の値が存在する負の領域
の音声波形電圧を負領域分離器5を用いて取り出し、こ
の波形に線形増幅器7を適用した出力波形を負領域の処
理済み波形電圧と言う。
【0024】さらに、ピーク電圧が保持された上記の正
領域の処理済み波形電圧とピーク電圧保持器を経由して
いない上記の負領域の処理済み波形電圧を音声波形合成
器9を用いて合成する。音声波形合成器9の具体的な回
路例を図10に示す。音声波形合成器9は線形素子であ
る2個の入力抵抗R14、R15とオペレーショナル・アン
プとよばれているアナログの演算増幅器およびフィード
バック抵抗R16を組み合わせて構成され、いわゆる、ア
ナログの加算器と同様な回路である。音声波形合成器9
の出力波形を正負合成波形電圧と言う。
【0025】さらに、上記の正負合成波形電圧に微分器
10を適用して微分波形電圧11を構成することによ
り、音声波形から声帯の振動ピッチに同期する音声基本
周期信号を得る。微分器10の構成の具体的な回路例を
図11に示す。図11に示す微分器10は線形増幅器の
入力抵抗をキャパシタC2に入れ換える事により構成さ
れる。微分器10は音声波形を微分して充分な大きさま
で増幅する。
【0026】以上に記述した工程を経由することにより
得られた音声基本周期検出の具体例とマイクロフォンに
より採取され線形増幅器により増幅された源音声信号を
図12に示す。図12において、上段は音声波形の源信
号であり、母音の「ア」を示し、下段は本発明の音声波
形処理装置を適用して得られた音声の基本周期信号であ
る。縦線は、得られた音声の基本周期信号の立ち上がり
に引いたものであり、極めて高精度に音声の基本周期が
検出されていることを示す。
【0027】音声基本周期検出の具体例とマイクロフォ
ンにより採取され線形増幅器により増幅された源音声信
号を拡大して図13に示す。図13において、上段は音
声波形の源信号の拡大表示であり、母音の「ア」を示
し、下段は本発明の音声波形処理装置を適用して得られ
た音声の基本周期信号の拡大表示である。縦線は、得ら
れた音声の基本周期信号の立ち上がりに引いたものであ
り、極めて高精度に音声の基本周期が検出されているこ
とを示す。
【0028】本発明の音声波形処理装置を適用すること
により、音声の基本周期がリアルタイムで、しかも高精
度に検出することが可能になる。音声の基本周期がリア
ルタイムに、しかも高精度に検出することが可能になる
と、音声認識、音声合成などの音声情報処理が容易にな
る。なお、音声波形の基本周期を検出するためには、前
述の処理工程を必要とするが、これらの工程の順序を少
し入れ換えても本発明と同様な結果が得られる可能性は
あるが、それらは本質的に本発明の処理と同様であり、
当然のことであるが、本発明の範囲内にあるものとす
る。
【0029】
【発明の効果】本発明の音声波形処理装置は、音声のリ
アルタイム処理が可能になり、高速かつ高精度に基本周
期を求めることができる。それは、本発明の音声波形処
理装置が、音声信号をA/Dコンバータでデジタル信号
に変換して、マイクロコンピューターなどで演算して基
本周期を求めるのではなくて、音声信号をアナログ回路
でリアルタイムに処理して、基本周期を求められるから
である。このような優れた特性の音声波形処理装置を利
用すると、音声の合成、音声の認識および音声情報処理
技術が飛躍的に向上して、コンピュータの入出力に音声
を利用する事が可能になる。さらに、マルチメディアに
おいて重要な役割を示す音声の加工が容易になり、音声
認識、音声圧縮、音声合成、音声再生、音声収録などの
分野において本発明の音声基本周期検出装置を用いるこ
とが可能になる。
【図面の簡単な説明】
【図1】本発明の実施例の音声波形処理装置の構成図
【図2】線形増幅器の構成例を示す回路図
【図3】線形増幅器の特性を示すグラフ
【図4】正領域分離器の構成例を示す回路図
【図5】負領域分離器の構成を示す回路図
【図6】負領域分離器の特性を示すグラフ
【図7】非線形増幅器の構成例を示す回路図
【図8】非線形増幅器の特性を示すグラフ
【図9】ピーク電圧保持器の構成例を示す回路図
【図10】音声波形合成器の構成例を示す回路図
【図11】微分器の構成例を示す回路図
【図12】音声波形と音声基本周期検出の具体例を示す
【図13】音声波形と音声基本周期検出の具体例を示す
拡大図
【符号の説明】
1…音声 2…マイクロフォン 3…線形増幅器 4…正領域分離器 5…負領域分離器 6…非線形増幅器 7…線形増幅器 8…ピーク電圧保持器 9…音声波形合成器 10…微分器 11…微分波形電圧

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 声帯が開かれて肺臓から空気が押し出さ
    れることにより発生する音声波形をマイクロフォン(2)
    により電圧値として測定し、上記の空気が押し出される
    ことにより発生する音声波形に対応する波形電圧が立ち
    上がる正のピーク電圧の値が存在する正の領域の音声波
    形電圧を正領域分離器(4)を用いて取り出し、上記の正
    の領域の音声波形電圧が大きい値において線形増幅器
    (7)によって増幅される値よりも大きな値となる非線形
    増幅器(6)を用いて増幅し、さらに上記の非線形増幅器
    (6)によって増幅された電圧のピーク値をピーク電圧保
    持器(8)により一定の期間だけ保持し、上記の音声波形
    に対応する波形電圧が立ち下がる負のピーク電圧の値が
    存在する負の領域の音声波形電圧を負領域分離器(5)を
    用いて取り出し、ピーク電圧が保持された上記の正の領
    域の音声波形電圧とピーク電圧保持器(8)を経由してい
    ない上記の負の領域の音声波形電圧を音声波形合成器
    (9)を用いて合成し、上記の合成音声波形電圧に微分器
    (10)を適用して微分波形電圧(11)を構成することにより
    音声波形から声帯振動のピッチに同期する音声基本周期
    信号を得る音声波形処理装置。
  2. 【請求項2】 ピーク電圧保持器(8)が、ピーク値を減
    衰させながら保持する請求項1に記載される音声波形処
    理装置。
JP17760397A 1997-06-17 1997-06-17 音声波形処理装置 Expired - Fee Related JP3145955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17760397A JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17760397A JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Publications (2)

Publication Number Publication Date
JPH117297A true JPH117297A (ja) 1999-01-12
JP3145955B2 JP3145955B2 (ja) 2001-03-12

Family

ID=16033895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17760397A Expired - Fee Related JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Country Status (1)

Country Link
JP (1) JP3145955B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272385A (ja) * 2000-03-28 2001-10-05 Toyo Seikan Kaisha Ltd 線形予測係数法を用いた打検方法および打検装置
JP2010521012A (ja) * 2007-03-09 2010-06-17 スカイプ・リミテッド 音声符号化システム及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272385A (ja) * 2000-03-28 2001-10-05 Toyo Seikan Kaisha Ltd 線形予測係数法を用いた打検方法および打検装置
JP2010521012A (ja) * 2007-03-09 2010-06-17 スカイプ・リミテッド 音声符号化システム及び方法

Also Published As

Publication number Publication date
JP3145955B2 (ja) 2001-03-12

Similar Documents

Publication Publication Date Title
JP2763322B2 (ja) 音声処理方法
Alku et al. Formant frequency estimation of high-pitched vowels using weighted linear prediction
US6173258B1 (en) Method for reducing noise distortions in a speech recognition system
JPH0990974A (ja) 信号処理方法
Ghadage et al. Speech to text conversion for multilingual languages
JPH08263097A (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
Dharanipragada et al. MVDR based feature extraction for robust speech recognition
US20140200889A1 (en) System and Method for Speech Recognition Using Pitch-Synchronous Spectral Parameters
Matsumoto et al. Evaluation of Mel-LPC cepstrum in a large vocabulary continuous speech recognition
RU2510954C2 (ru) Способ переозвучивания аудиоматериалов и устройство для его осуществления
JP3145955B2 (ja) 音声波形処理装置
AlTalmas et al. Analysis of two adjacent articulation Quranic letters based on MFCC and DTW
JPH07191696A (ja) 音声認識装置
Joshi et al. Extraction of feature vectors for analysis of musical instruments
JP2806048B2 (ja) 自動採譜装置
JP4576612B2 (ja) 音声認識方法および音声認識装置
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
US5899974A (en) Compressing speech into a digital format
Alku et al. PAAPPA-a flexible computer environment for the analysis of the voice source
Undhad et al. Exploiting speech source information for vowel landmark detection for low resource language
JPH0318720B2 (ja)
Wiriyarattanakul et al. Reducing DFT Leakage in Speech Recognition Using Pitch Segmentation
JPS6227798A (ja) 音声認識装置
Simic et al. Normalization of audio signals for the needs of machine learning
Latha et al. Performance Analysis of Kannada Phonetics: Vowels, Fricatives and Stop Consonants Using LP Spectrum

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees