JP3145955B2 - 音声波形処理装置 - Google Patents

音声波形処理装置

Info

Publication number
JP3145955B2
JP3145955B2 JP17760397A JP17760397A JP3145955B2 JP 3145955 B2 JP3145955 B2 JP 3145955B2 JP 17760397 A JP17760397 A JP 17760397A JP 17760397 A JP17760397 A JP 17760397A JP 3145955 B2 JP3145955 B2 JP 3145955B2
Authority
JP
Japan
Prior art keywords
voltage
waveform
voice
value
audio waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17760397A
Other languages
English (en)
Other versions
JPH117297A (ja
Inventor
則男 赤松
Original Assignee
則男 赤松
佐渡 三智子
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 則男 赤松, 佐渡 三智子 filed Critical 則男 赤松
Priority to JP17760397A priority Critical patent/JP3145955B2/ja
Publication of JPH117297A publication Critical patent/JPH117297A/ja
Application granted granted Critical
Publication of JP3145955B2 publication Critical patent/JP3145955B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声波形の基本周
期を演算する処理装置に関する。
【0002】
【従来の技術】本発明の音声波形処理装置は、音声の基
本周期をリアルタイムに演算するものであるが、本明細
書において、音声の基本周波数は下記の意味で使用す
る。母音(ア、イ、ウ、エ、オ)および半母音や鼻音な
どの子音の一部は、音声波形に周期性がある。この周期
を音声の基本周期あるいはピッチ周期と言う。さらに、
音声の基本周期の逆数を音声の基本周波数と言い、音声
のピッチ周期の逆数をピッチ周波数と言う。成人男子の
基本周波数は100ヘルツから150ヘルツであり、成
人女子の基本周波数は200ヘルツから300ヘルツで
あり、子供の基本周波数は250ヘルツから400ヘル
ツである。
【0003】音声認識および音声合成などの音声処理を
行うためには、音声の基本周期を検出する必要がある。
音声の基本周期は、音声の発生源である声帯振動のピッ
チ周期を音声波形から推定することに相当し、音声信号
処理の基本的な技術であり、多くの研究成果がある。そ
の方法の大部分はディジタル信号処理である。これまで
に開発された音声の基本周波数の検出方法の主なものを
以下に記述する。
【0004】 フーリェ変換を用いて音声の基本周波
数を検出する方法高速フーリェ変換(FFT)の演算ア
ルゴリズムは信号処理においてあまりに有名であり、信
号処理の全ての書物に記載されているので、その詳細は
省略する。比較的短時間の音声波形にFFT法を適用す
ると、容易に音声の基本周波数を検出することが可能で
あり、従来はこの方法を基本として少し改良し、ハミン
グやハニングなどの窓関数を適用して音声のピッチ周期
を算出していた。
【0005】 ケプストラム分析を用いて音声の基本
周波数を検出する方法音声波は音源波と声道のインパル
ス応答との畳み込みとして表現される。この関係に離散
フーリェ変換の絶対値の対数演算操作を施し、その逆離
散フーリェ変換をケプストラムと呼ぶ。ケプストラム分
析を適用して音声の基本周波数を求めることができる。
【0006】 線形予測分析を用いて音声の基本周波
数を検出する方法音声波形のサンプル時系列から最少2
乗法を適用して線形予測係数を推定し、線形予測係数を
用いて音声波形を表現する。この際に、自己相関法ある
いは共分散法を用いる。さらに、周波数スペクトラムを
求めて音声波形の基本周期を求めることができる。
【0007】
【発明が解決しようとする課題】音声波形の基本周期を
従来の方法を用いて求めると、次に示す短所がある。
従来の信号処理方法はディジタル方式であるので、音
声波をアナログからディジタルに変換する必要があり、
A/D変換器を必要とする。 従来の信号処理方法は
積分あるいは加算演算等を施すので、音声波形の時間的
に初期から基本周期をリアルタイムで決定することはで
きない。 従来の信号処理方法はディジタル方式であ
り、音声の基本周期を求めるための演算時間を必要とす
るので、高速なリアルタイム処理には適さない。 従
来の信号処理技術であるフーリェ変換法、ケプストラム
分析法および線形予測分析法を適用すると、音声波形の
時系列に加算和を求める演算を必要とするので、個々の
音声信号に対する基本周期を高精度で求めることはでき
ないし、高速にリアルタイムで基本周期信号を決定する
ことはできない。すなわち、これらの方法は、全てディ
ジタル方式であるので、基本周期に同期した信号の精度
が悪い。
【0008】本発明は、この欠点を解決することを目的
に開発されたものである。本発明の重要な目的は、A/
D変換器を使用することなく、音声信号をリアルタイム
で処理して、高速かつ高精度に音声基本周期を求めるこ
とができる音声波形処理装置を提供することにある。
【0009】
【課題を解決するための手段】本発明の音声波形処理装
置は下記の構成で、音声の基本周期を演算する。声波
形をマイクロフォン2により電圧値として測定する。マ
イクロフォン2で測定された音声波形であって、音声波
形に対応する波形電圧が立ち上がる正のピーク電圧の値
が存在する正の領域の音声波形電圧を、正領域分離器4
を用いて取り出す。正の領域の音声波形電圧が大きい値
において線形増幅器7によって増幅される値よりも大き
な値となる非線形増幅器6を用いて増幅する。さらに非
線形増幅器6によって増幅された電圧のピーク値をピー
ク電圧保持器8により一定の期間だけ保持する。上記の
音声波形に対応する波形電圧が立ち下がる負のピーク電
圧の値が存在する負の領域の音声波形電圧を負領域分離
器5を用いて取り出す。ピーク電圧が保持された上記の
正の領域の音声波形電圧と、ピーク電圧保持器8を経由
していない負の領域の音声波形電圧を音声波形合成器9
を用いて加算する。合成音声波形電圧に微分器10を適
用して微分して、声帯振動のピッチに同期する音声基本
周期信号を得る。
【0010】音声波形の基本周期を従来の装置で演算す
ると、前述に示す短所があるので、それらを本発明の方
法によって解決する。 従来の信号処理方法はディジ
タル方式であるので、音声波をアナログからディジタル
に変換する必要があり、A/D変換器を必要とする。し
かし、A/D変換器は高価であり、超高速変換が困難で
あるので、本発明の音声波形処理装置は、A/D変換器
を用いずに直接的にアナログの音声波形に音声波形の基
本周期検出法を適用する。
【0011】 従来の信号処理方法は数値積分あるい
は数値加算演算等を施すので、音声波形の時系列の初期
から基本周期に同期した信号を設定することはできな
い。しかし、本発明の音声波形処理装置は、直接的にア
ナログの音声波形に非線形演算回路および微分回路など
を適用して音声波形の基本周期を高精度かつ高速に検出
する。
【0012】 従来の信号処理方法はディジタル方式
であり、基本周期を求めるための演算時間を必要とする
ので、リアルタイム処理には適さない。しかし、本発明
の音声波形処理装置は、直接的にアナログの音声波形に
非線形演算回路および微分回路などを適用して音声波形
の基本周期を求めるので、リアルタイム処理が可能にな
る。
【0013】 従来の信号処理方法はディジタル方式
であるので、基本周期に同期した信号の精度が悪い。し
かし、本発明の音声波形処理装置は、直接的にアナログ
の音声波形に非線形演算回路および微分回路などを適用
して音声波形の基本周期を求めるので、基本周期に同期
した信号の精度は良好である。
【0014】
【発明の実施の形態】以下、本発明の実施例を図面に基
づいて説明する。ただし、以下に示す実施例は、本発明
の技術思想を具体化するための音声波形処理装置を例示
するものであって、本発明は音声波形処理装置を下記の
ものに特定しない。
【0015】さらに、この明細書は、特許請求の範囲を
理解し易いように、実施例に示される部材に対応する番
号を、「特許請求の範囲の欄」、および「課題を解決す
るための手段の欄」に示される部材に付記している。た
だ、特許請求の範囲に示される部材を、実施例の部材に
特定するものでは決してない。
【0016】本発明の音声波形処理装置を構成実施例で
ある図1を用いて説明する。図1において、声帯が開放
されて肺臓から空気が押し出されることにより発生する
音声1をマイクロフォン2により電圧信号に変換するこ
とにより採取し、採取した小さな信号レベルを、線形増
幅器3を適用して大きなレベルに増幅する。線形増幅器
3の構成例を図2に示し、線形増幅器の特性例を図3に
示す。線形増幅器3はオペレーショナル・アンプと呼ば
れるアナログの演算増幅器と入力抵抗R1およびフィー
ドバック抵抗R2により構成される。線形増幅器の特性
例は、図3に示すように、入力と出力の関係が直線的な
線形関数で表現される。
【0017】さらに、上記の増幅された音声波形を正領
域と負領域に分割する。ここに、音声波形の正領域と
は、音声波形に対応する波形電圧が立ち上がる正のピー
ク電圧の値が存在する正の領域の音声波形である。音声
波形の負領域とは、音声波形電圧が立ち下がる負のピー
ク電圧の値が存在する負の領域の音声波形である。
【0018】音声波形電圧に正領域分離器4を適用し
て、正領域の音声波形を取り出す。正領域分離器4を構
成するための実施回路例を図4に示す。図4に示す正領
域分離器4には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が負の場合には
出力電圧が正になり、ダイオードD2が導通して出力電
圧は零になる。入力電圧が正の場合には出力電圧が負に
なり、ダイオードD1が導通して通常の線形増幅器とな
り、正の入力電圧に比例した出力電圧が得られる。
【0019】音声波形電圧に負領域分離器5を適用し
て、負領域の音声波形を取り出す。負領域分離器5を構
成するための実施回路例を図5に示す。図5に示す負領
域分離器5には、ダイオードなどの非線形素子とオペレ
ーショナル・アンプとよばれているアナログの演算増幅
器を組み合わせて構成される。入力電圧が正の場合には
出力電圧が負になり、ダイオードD4が導通して出力電
圧は零になる。入力電圧が負の場合には出力電圧が正に
なり、ダイオードD3が導通して通常の線形増幅器とな
り、負の入力電圧に比例した出力電圧が得られる。負領
域分離器5の特性を図6に示す。音声波形の負領域のみ
が出力されており、正領域の音声信号の出力は零であ
る。なお、正領域分離器4の特性を図示していないが、
これは負領域分離器5の特性の符号を変えたものであ
り、正領域分離器4の特性は音声波形の正領域のみが出
力されて、負領域の音声信号の出力は零である。
【0020】つぎに、上記の正領域の音声波形電圧に非
線形増幅器6を適用して増幅する。ここに、非線形増幅
器6の構成の実施例を図7に示す。さらに、非線形増幅
器6の特性を図8に示す。すなわち、増幅器の入力と出
力の関係が直線的でない増幅器を非線形増幅器と言う。
線形増幅器においては、その出力電圧は入力電圧に比例
するが、非線形増幅器においては、その出力電圧は入力
電圧に比例しない。この場合の非線形性はダイオードな
どの非線形素子によって実現される。
【0021】さらに、上記の負領域の音声波形電圧に線
形増幅器7を適用して増幅する。ここに、線形増幅器7
の構成の実施例は図2に示した回路と同じであり、線形
増幅器7の特性は図3に示したものと同じであるので、
ここには省略する。すなわち、増幅器の入力と出力の関
係が直線的である増幅器を線形増幅器と言う。線形増幅
器においては、その出力電圧は入力電圧に比例する。
【0022】つぎに、上記の正領域の音声波形電圧に非
線形増幅器6を適用して増幅された音声波形にピーク電
圧保持器8を適用して、電圧の正のピーク値を一定の期
間だけ保持する。ここに、ピーク電圧保持器の具体的な
回路例を図9に示す。ダイオードD9を通過した正の信
号電圧のピーク値がキャパシタC1によって保持され
る。同図の演算増幅器とフィードバック回路により入力
信号電圧が良好に保持されてピーク電圧保持器8を構成
する。保持されたピーク電圧を抵抗R13により減衰させ
る。このときの時定数=RCを最適値に実験的に定め
る。ここに、抵抗R13の代わりに可変抵抗素子であるト
ランジスタやFETを用いて、初期にはこれらの可変抵
抗素子を高抵抗となるように制御してピーク電圧を保持
し、一定の期間後に可変抵抗素子であるトランジスタや
FETを低抵抗となるように制御して、保持されたピー
ク電圧を強制的に減衰させる方法も本発明の範囲内であ
る。ピーク電圧保持器8からの出力波形を正領域の処理
済み波形電圧と言う。
【0023】つぎに、上記の音声波形に対応する波形電
圧が立ち下がる負のピーク電圧の値が存在する負の領域
の音声波形電圧を負領域分離器5を用いて取り出し、こ
の波形に線形増幅器7を適用した出力波形を負領域の処
理済み波形電圧と言う。
【0024】さらに、ピーク電圧が保持された上記の正
領域の処理済み波形電圧とピーク電圧保持器を経由して
いない上記の負領域の処理済み波形電圧を音声波形合成
器9を用いて合成する。音声波形合成器9の具体的な回
路例を図10に示す。音声波形合成器9は線形素子であ
る2個の入力抵抗R14、R15とオペレーショナル・アン
プとよばれているアナログの演算増幅器およびフィード
バック抵抗R16を組み合わせて構成され、いわゆる、ア
ナログの加算器と同様な回路である。音声波形合成器9
の出力波形を正負合成波形電圧と言う。
【0025】さらに、上記の正負合成波形電圧に微分器
10を適用して微分波形電圧11を構成することによ
り、音声波形から声帯の振動ピッチに同期する音声基本
周期信号を得る。微分器10の構成の具体的な回路例を
図11に示す。図11に示す微分器10は線形増幅器の
入力抵抗をキャパシタC2に入れ換える事により構成さ
れる。微分器10は音声波形を微分して充分な大きさま
で増幅する。
【0026】以上に記述した工程を経由することにより
得られた音声基本周期検出の具体例とマイクロフォンに
より採取され線形増幅器により増幅された音声信号を
図12に示す。図12において、上段は音声波形の
号であり、母音の「ア」を示し、下段は本発明の音声波
形処理装置を適用して得られた音声の基本周期信号であ
る。縦線は、得られた音声の基本周期信号の立ち上がり
に引いたものであり、極めて高精度に音声の基本周期が
検出されていることを示す。
【0027】音声基本周期検出の具体例とマイクロフォ
ンにより採取され線形増幅器により増幅された音声信
号を拡大して図13に示す。図13において、上段は音
声波形の信号の拡大表示であり、母音の「ア」を示
し、下段は本発明の音声波形処理装置を適用して得られ
た音声の基本周期信号の拡大表示である。縦線は、得ら
れた音声の基本周期信号の立ち上がりに引いたものであ
り、極めて高精度に音声の基本周期が検出されているこ
とを示す。
【0028】本発明の音声波形処理装置を適用すること
により、音声の基本周期がリアルタイムで、しかも高精
度に検出することが可能になる。音声の基本周期がリア
ルタイムに、しかも高精度に検出することが可能になる
と、音声認識、音声合成などの音声情報処理が容易にな
る。なお、音声波形の基本周期を検出するためには、前
述の処理工程を必要とするが、これらの工程の順序を少
し入れ換えても本発明と同様な結果が得られる可能性は
あるが、それらは本質的に本発明の処理と同様であり、
当然のことであるが、本発明の範囲内にあるものとす
る。
【0029】
【発明の効果】本発明の音声波形処理装置は、音声のリ
アルタイム処理が可能になり、高速かつ高精度に基本周
期を求めることができる。それは、本発明の音声波形処
理装置が、音声信号をA/Dコンバータでデジタル信号
に変換して、マイクロコンピューターなどで演算して基
本周期を求めるのではなくて、音声信号をアナログ回路
でリアルタイムに処理して、基本周期を求められるから
である。このような優れた特性の音声波形処理装置を利
用すると、音声の合成、音声の認識および音声情報処理
技術が飛躍的に向上して、コンピュータの入出力に音声
を利用する事が可能になる。さらに、マルチメディアに
おいて重要な役割を示す音声の加工が容易になり、音声
認識、音声圧縮、音声合成、音声再生、音声収録などの
分野において本発明の音声基本周期検出装置を用いるこ
とが可能になる。
【図面の簡単な説明】
【図1】本発明の実施例の音声波形処理装置の構成図
【図2】線形増幅器の構成例を示す回路図
【図3】線形増幅器の特性を示すグラフ
【図4】正領域分離器の構成例を示す回路図
【図5】負領域分離器の構成を示す回路図
【図6】負領域分離器の特性を示すグラフ
【図7】非線形増幅器の構成例を示す回路図
【図8】非線形増幅器の特性を示すグラフ
【図9】ピーク電圧保持器の構成例を示す回路図
【図10】音声波形合成器の構成例を示す回路図
【図11】微分器の構成例を示す回路図
【図12】音声波形と音声基本周期検出の具体例を示す
【図13】音声波形と音声基本周期検出の具体例を示す
拡大図
【符号の説明】
1…音声 2…マイクロフォン 3…線形増幅器 4…正領域分離器 5…負領域分離器 6…非線形増幅器 7…線形増幅器 8…ピーク電圧保持器 9…音声波形合成器 10…微分器 11…微分波形電圧
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 電子通信学会編「聴覚と音声」第10版 (昭51−8−15)社団法人電子通信学会 発行 p.186−203 大泉監修,藤村編「音声科学」(1972 −3−10)東京大学出版会 p.104− 120 (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声波形をマイクロフォン(2)により電
    圧値として測定し、音声波形に対応する波形電圧が立ち
    上がる正のピーク電圧の値が存在する正の領域の音声波
    形電圧を正領域分離器(4)を用いて取り出し、上記の正
    の領域の音声波形電圧が大きい値において線形増幅器
    (7)によって増幅される値よりも大きな値となる非線形
    増幅器(6)を用いて増幅し、さらに上記の非線形増幅器
    (6)によって増幅された電圧のピーク値をピーク電圧保
    持器(8)により一定の期間だけ保持し、上記の音声波形
    に対応する波形電圧が立ち下がる負のピーク電圧の値が
    存在する負の領域の音声波形電圧を負領域分離器(5)を
    用いて取り出し、ピーク電圧が保持された上記の正の領
    域の音声波形電圧とピーク電圧保持器(8)を経由してい
    ない上記の負の領域の音声波形電圧を音声波形合成器
    (9)を用いて加算し、上記の合成音声波形電圧に微分器
    (10)を適用して微分波形電圧(11)を構成することにより
    音声波形から声帯振動のピッチに同期する音声基本周期
    信号を得る音声波形処理装置。
  2. 【請求項2】 ピーク電圧保持器(8)が、ピーク値を減
    衰させながら保持する請求項1に記載される音声波形処
    理装置。
JP17760397A 1997-06-17 1997-06-17 音声波形処理装置 Expired - Fee Related JP3145955B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17760397A JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17760397A JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Publications (2)

Publication Number Publication Date
JPH117297A JPH117297A (ja) 1999-01-12
JP3145955B2 true JP3145955B2 (ja) 2001-03-12

Family

ID=16033895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17760397A Expired - Fee Related JP3145955B2 (ja) 1997-06-17 1997-06-17 音声波形処理装置

Country Status (1)

Country Link
JP (1) JP3145955B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001272385A (ja) * 2000-03-28 2001-10-05 Toyo Seikan Kaisha Ltd 線形予測係数法を用いた打検方法および打検装置
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
大泉監修,藤村編「音声科学」(1972−3−10)東京大学出版会 p.104−120
電子通信学会編「聴覚と音声」第10版(昭51−8−15)社団法人電子通信学会発行 p.186−203

Also Published As

Publication number Publication date
JPH117297A (ja) 1999-01-12

Similar Documents

Publication Publication Date Title
US6173258B1 (en) Method for reducing noise distortions in a speech recognition system
Molau et al. Computing mel-frequency cepstral coefficients on the power spectrum
US6768979B1 (en) Apparatus and method for noise attenuation in a speech recognition system
JPH0990974A (ja) 信号処理方法
Dharanipragada et al. MVDR based feature extraction for robust speech recognition
JP3145955B2 (ja) 音声波形処理装置
RU2510954C2 (ru) Способ переозвучивания аудиоматериалов и устройство для его осуществления
JP3354252B2 (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
JPS5972500A (ja) 音声認識方式
JP3102089B2 (ja) 自動採譜装置
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
Joshi et al. Extraction of feature vectors for analysis of musical instruments
Dubey et al. Hypernasality detection using zero time windowing
CN110634473A (zh) 一种基于mfcc的语音数字识别方法
Vikram et al. Acoustic analysis of misarticulated trills in cleft lip and palate children
JPH0318720B2 (ja)
JPH07295588A (ja) 発話速度推定方法
JP2806048B2 (ja) 自動採譜装置
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
JPS60129796A (ja) 音声入力装置
JPH05100661A (ja) 小節境界時刻抽出装置
Ito et al. Forward masking on a generalized logarithmic scale for robust speech recognition
Simic et al. Normalization of audio signals for the needs of machine learning
Alku et al. PAAPPA-a flexible computer environment for the analysis of the voice source

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees