JPH0652479B2 - 音声分析方式 - Google Patents

音声分析方式

Info

Publication number
JPH0652479B2
JPH0652479B2 JP61260586A JP26058686A JPH0652479B2 JP H0652479 B2 JPH0652479 B2 JP H0652479B2 JP 61260586 A JP61260586 A JP 61260586A JP 26058686 A JP26058686 A JP 26058686A JP H0652479 B2 JPH0652479 B2 JP H0652479B2
Authority
JP
Japan
Prior art keywords
voice
circuit
signal
analysis
power information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61260586A
Other languages
English (en)
Other versions
JPS63115200A (ja
Inventor
延久 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61260586A priority Critical patent/JPH0652479B2/ja
Publication of JPS63115200A publication Critical patent/JPS63115200A/ja
Publication of JPH0652479B2 publication Critical patent/JPH0652479B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Selective Calling Equipment (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、人間が発声した音声を所定の符号化方式によ
り量子化、符号化し、これを音声データとして静止形記
憶媒体に格納しておき、この音声データを用いて案内等
のアナウンスを行う音声合成装置における音声信号の符
号化方式に係り、特に、原音声による音声信号の自動切
り出しに有効な信号処理方式を持つた音声分析方式に関
する。
〔従来の技術〕
音声合成装置に用いる音声データの作成において、人間
の発声した音声を用い、この音声信号の特性を利用し、
音声信号から有効な音声部分のみを自動的に切り出す従
来技術は、これまでのところ知られていない。
〔発明が解決しようとする問題点〕
従来、人間が発声した原音声による音声信号を予め分析
し、音声データとして音声合成装置内に格納し、音声合
成時、装置内に格納されている音声データを用いて音声
出力を行う音声合成装置において、音声信号の分析時、
音声信号のうち、無音部、有音部等の判定は、装置取り
扱い者の知識、経験により行われるところが多く、自動
的に行うことが困難であり、作業時間が多く必要である
という問題点があつた。また、原音声信号からの有効な
音声信号の切り出し処理は、原音声信号の全周波数帯域
における電力情報に基いて、音声信号の無音部、有音部
を判定して行われており、有効な音声信号部分と暗騒音
とを区別できない場合が生じるという問題点があり、特
に、音声信号の先頭に摩擦音や破裂音等、電力情報とし
てみると暗騒音とほとんど区別できない低レベルの信号
が存在する場合に顕著である。
本発明の目的は、前記問題点を解決し、原音声信号から
有効な音声信号部分を自動的に切り出すことができる音
声分析方式を提供することにある。
〔問題点を解決するための手段〕
本発明によれば、前記目的は、原音声信号を複数の周波
数帯域に分け、それぞれの周波数帯域毎に電力情報を算
出し、この周波数帯域毎に有効な音声信号と暗騒音とを
分離して、有効な音声信号部分を切り出すことにより達
成される。
〔作用〕
一般に、暗騒音の電力情報は、低い周波数帯域に分布し
ており、一方、音声信号のうち、摩擦音や破裂音の電力
情報は、比較的高い周波数帯域に分布している。従つ
て、原音声信号を複数の周波数帯域に分けてその周波数
帯域毎に電力情報を算出すると、摩擦音、破裂音等の音
声部分を含む比較的高い周波数帯域では、暗騒音による
電力情報がほとんど存在せず、容易に有効な音声信号部
分のみを切出すことができる。
〔実施例〕
まず、本発明の原理を図面により説明する。
第4図は人間が発声した音声「Sa」の音声波形と、こ
の音声の全周波数帯域における電力情報を示す図、第5
図は音声「Sa」の音声波形と、音声「Sa」の前部に
ある摩擦音部の周波数−音圧特性を示す図、第6図は一
般的な音声と暗騒音が有する周波数帯域と音圧の範囲を
示す図、第7図は音声「Sa」の音声波形と、この音声
「Sa」の周波数帯域を複数の周波数帯域4KHz〜3K
Hz,3KHz〜2KHz,2KHz〜1KHzおよび1KHz以下
に分けた場合の夫々の電力情報を示す図である。
第4,5,7図の(i)に示すように、人間が例えば
「Sa」と発声した場合の音声信号の波形は、音声信号
の先頭部における子音部「S」に相当するレベルの低
い、100ms程度の長さの摩擦音と、これに続く母音
部「a」に相当する比較的レベルの高い音声部とより成
る。このような信号波形を有する音声信号の全周波数帯
域における電力情報は、第4図(ii)に示すように、摩
擦音部で低く、その他の部分で比較的高いレベルを持つ
ている。そして、このような音声信号の分析時に、音声
信号の全周波数帯域での電力情報によつて有効な音声部
分の切出し処理を行う場合、摩擦音部は、暗騒音中に埋
没してしまい暗騒音と区別することができない。
ところで、人間が発声する音声、例えば「Sa」におけ
る摩擦音部の周波数特性を見ると、第5図(ii)に示す
ように、3KHz以上の高い周波数領域において高いレベ
ルを有している。一方、第6図に見るとおり、音声信号
の周波数帯域は、4KHz程度の高い周波数帯域を含むの
に対し、暗騒音の周波数帯域は、高々3KHzまでの周波
数しか含んでいない。
従つて、人間が発声した音声を複数の周波数帯域に分
け、それぞれの周波数帯域での電力情報によつて有効な
音声信号の切出しを行うようにすれば、摩擦音、破裂音
等の全周波数帯域にわたる電力情報によつては暗騒音と
ほとんど区別することのできない音声信号が、明白に暗
騒音と区別できることになる。すなわち、人間が発声し
た音声「Sa」を4KHz〜3KHz,3KHz〜2KHz,2
KHz〜1KHz,1KHz以下の4つの周波数帯域に分けた
場合のそれぞれの周波数帯域における電力情報が第7図
(ii)〜第7図(v)に示されており、第7図(ii)に
示す4KHz〜3KHzの帯域では、摩擦音の電力情報のみ
が含まれ、暗騒音による電力情報を含んでおらず、音声
信号のはじまりを検出することができる。
本発明は、音声合成装置に用いる音声データの作成にお
いて、前述のような原音声信号を複数の周波数帯域に分
け、これらの周波数帯域の電力情報のそれぞれから有効
な音声信号の切出しを行うものである。
次に本発明による音声分析方式の一実施例を図面により
詳細に説明する。
第1図は本発明を適用した音声分析合成装置の全体構成
図、第2図は音声信号分析回路の詳細図、第3図は音声
信号分析回路の動作を説明するための音声信号波形と、
この音声信号の周波数帯域を複数の周波数帯域4KHz〜
3KHz,3KHz〜2KHz,2KHz〜1KHz,1KHz以下
に分けた場合の夫々の電力情報と、スレツシユホルドレ
ベルと、音声信号検出信号波形の関係を示す図である。
第1図,第2図において、1は処理制御回路、2は制御
用メモリ回路、3はデータ伝送回路、4は分析合成制御
回路、5は音声復号化回路、6は音声符号化回路、7は
音声信号分析回路、8はD/A変換回路、9はA/D変
換回路、10は音声データメモリ回路、71〜74は電
力情報演算部、701はバンドパスフイルタ(以下、B
PFという)、702はパワー演算部、703はパワー
レジスタ、704は比較器、705はスレツシユホルド
レジスタ、101〜103,201〜203はバスであ
る。
第1図において、処理制御回路1は、マイクロプロセツ
サ等により構成され、図示音声分析合成装置全体の動作
を制御し、音声分析合成処理の実行を制御する。制御用
メモリ回路2は、音声分析合成を制御する制御プログラ
ムおよび制御データが格納されており、制御処理回路1
がこれらのデータを利用する。データ伝送回路3は、本
装置の動作を外部から制御するための指令等の送受信を
行う。これらの処理制御回路1、制御用メモリ回路2、
データ伝送回路3は、アドレスバス101、データバス
102、制御用バス103を介して相互に接続されると
ともに分析合成制御回路4に接続されている。分析合成
制御回路4は、データバス202、制御用バス203を
介して音声復合化回路5、音声符号化回路6に接続され
るとともに、前記バス202,203およびアドレスバ
ス201 を介して音声信号分析回路7、音声データメモリ
回路10に接続され、処理制御回路1の指令に従い、音
声符号化回路6から音声データメモリ回路10へ、ま
た、音声データメモリ回路10から音声復号化回路5へ
のデータの転送等を制御し、音声の分析合成を直接制御
する。音声符号化回路6は、A/D変換回路9により所
定のサンプリング周期により取込まれ量子化された音声
信号を符号化する。音声信号の符号化方式としては各種
の方法が知られているが、本発明ではいずれの方法であ
つてもよい。音声復号化回路5は、音声データメモリ1
0から与えられた音声データを音声合成し、D/A変換
回路8を介してアナログ音声として出力する。本発明に
おいては、音声分析により作成された音声データの内容
をこの音声復号化回路5を介して再生させることにより
確認することができる。音声信号分析回路7は、A/D
変換回路9を介して入力される音声信号の量子化信号か
ら、音声信号を複数の周波数帯域に分け、その周波数帯
域毎の電力情報を算出して、有効な音声信号を切出すた
めの音声信号検出回路を出力するもので、音声符号化回
路6と同時に並列的に動作する。音声データメモリ回路
10は、音声符号化回路6により符号化され、音声信号
分析回路7の出力により切出された有効な音声データを
格納する。音声データメモリ回路10に格納された音声
データは、適宜取出され、音声復号化回路5により合成
されて利用される。
このように構成された音声分析合成装置における音声信
号の分析処理動作を以下に説明する。
音声分析の対象となる原音声信号は、信号線401を介
してA/D変換回路9に入力される。A/D変換回路9
は、所定のサンプリング周期に従つて原音声信号を取込
み量子化する。量子化された音声信号は、音声符号化回
路6と音声信号分析回路7に同時に入力される。音声符
号化回路6は、所定の符号化方式により音声信号の符号
化を行う。音声信号分析回路7は、入力音声信号を復数
の周波数帯域に分け、各周波数帯域毎の電力情報を算出
して音声信号検出信号を発生する。音声符号化回路6に
より符号化された音声信号は、分析合成制御回路4の制
御の下に、前記音声信号検出信号によりその有効な音声
信号のみが切出されて音声データメモリ回路10の所定
のエリアに格納される。有効な音声信号の切出しは、音
声信号分析回路7内で算出した複数の周波数帯域の電力
情報をもとに作られる音声信号検出信号により、音声符
号化回路6から出力される符号化された音声信号のどこ
からどこまで有効であるかを判断して行われる。このた
め、音声信号分析回路7における複数の周波数帯域毎の
電力情報の算出と、音声符号化回路6における音声信号
の符号化処理は、同時に並行して進められる。
音声信号分析回路7は、すでに第4図〜第7図により説
明した原理に従つて、有効な音声信号を切出すための音
声信号検出信号を出力するが、次にこの音声信号分析回
路7の詳細な構成と動作を第2図および第3図により説
明する。
音声信号分析回路7は、第2図に示すように4個の周波
数帯域毎の音声信号の電力情報を演算する電力情報演算
部71〜74により構成され、各電力情報演算部71〜
74は、周波数帯域分割用のBPF701、音声信号電
力情報を計算するパワー演算部702、演算された音声
信号電力情報を保持するパワーレジスタ703、音声信
号パワーの任意の一定値を格納するスレツシユホルドレ
ジスタ705およびパワーレジスタ703の内容とスレ
ツシユホルドレジスタ705の内容とを比較する比較器
704により構成される。第2図に示す音声分析回路7
は、音声信号の周波数帯域を4分割しているが、音声信
号の周波数帯域分割は、音声信号と暗騒音信号との分
離、音声信号の存在の検出が可能な数だけ行えばよい。
第2図における電力情報演算部71〜74は、それぞ
れ、4KHz〜3KHz,3KHz〜2KHz,2KHz〜1KH
z,1KHz以下の各周波数帯域をBPF701より取出
し、この各周波数帯域毎の音声信号電力情報をパワー演
算部702により計算し、その結果をパワーレジスタ7
03に格納するとともに、各周波数帯域の音声信号電力
の変化を、スレツシユホルドレジスタ705内の設定値
との比較によつて検出している。
音声信号を暗騒音と区別するため、音声信号を複数の周
波数帯域に分割すると、各周波数帯域毎の音声信号電力
情報の出現レベルは、その周波数帯域毎に異なるものと
なる。従つて、スレツシユホルドレジスタ705には、
各周波数帯域毎に適切な値を設定し、各周波数帯域毎に
音声信号の発声を検出する必要がある。例えば、音声信
号のうち摩擦音等、比較的高い周波数帯域に主な成分を
有する音声部分は、暗騒音とは区別できるが、音声信号
電力情報が他の周波数帯域に比べ小さいため、このよう
な周波数帯域の電力情報を算出する電力情報演算部71
のスレツシユホルドレジスタ705に設定する音声信号
電力情報の設定値は、小さな値としなければならない。
第3図(i)〜(v)は、原音声信号より、音声合成出
力のために用いる音声データを作成する場合の、音声信
号波形と各周波数帯域毎のスレツシユホルドレベル、音
声信号電力情報および音声信号検出信号との関係を示し
ており、第3図(ii)〜(v)が、夫々第2図における
電力情報演算部71〜74の動作を説明するものであ
る。
4KHz〜3KHzの比較的高い周波数帯域における音声信
号の電力情報を算出する電力情報演算部71は、第3図
(ii)に示すように、音声信号の摩擦音に相当する部分
の電力情報を算出するが、この電力情報は、図示のごと
く小さく、従つてスレツシユホルドレジスタ705に設
定される設定値も小さくされる。しかし、この4KHz〜
3KHzの周波数帯域には、暗騒音を含まないため、スレ
ツシユホルドレジスタ705の設定値を小さくしても、
暗騒音の影響を受けることなく、有効な音声信号を切出
すための正確な音声信号検出信号を比較器704から得
ることができる。この周波数帯域における音声信号検出
信号は、音声信号の立上りを検出するために有効であ
る。
一方、2KHz〜1KHzおよび1KHz以下の周波数帯域に
は、暗騒音による音声成分を含むが、この周波数帯域の
音声信号の電力情報は、大きなものである。従つて、こ
のような周波数帯域を扱う電力情報演算部73,74の
スレツシユホルドレジスタには、第3図(iv),(v)
に示すように比較的大きな値が設定され、これにより暗
騒音の影響を受けずに有効な音声信号を切出すための音
声信号検出信号が比較器より得られる。
このようにして、複数の電力情報演算部71〜74より
得られた、複数の周波数帯域毎の音声信号検出信号は、
分析合成制御回路4に送られる。分析合成制御回路4
は、音声信号検出信号の論理和を取り、いずれか1つが
音声信号の存在を検出していれば、音声信号が存在する
ものとして、音声符号化回路6からの符号化された音声
信号を切出し、音声データとして音声データメモリ回路
10に格納する。
前述した本発明の実施例において、比較的高い周波数帯
域で音声信号を検出する場合、スレツシユホルドレジス
タへの設定値との関係で、若干、音声信号の立上り部分
を落すことになるが、得られた音声データを合成再生す
る場合には、人間の聴覚上特に問題とならない。音声デ
ータメモリ回路10のデータ格納領域に、余裕がある場
合、音声信号検出信号の立上りより一定時間前より、音
声データを取込むようにすれば、前述した音声信号の立
上り部分の欠落を防止することができる。
〔発明の効果〕
以上説明したように、本発明によれば、音声合成装置に
用いる音声データの作成において、暗騒音を含んだ原音
声信号より、有効な音声信号の切出しを行う音声分析を
自動的に行うことができ、これにより、従来、ある程度
の知識と経験をもつた作業者が、試行錯誤的に行つてい
た作業を、不特定の人間により、あたかも、テープレコ
ーダに音声を録音するような容易な作業で行うことがで
きる。従つて、音声データ作成作業時間の短縮、音声デ
ータ作成コストの低減を計ることが可能となる。
【図面の簡単な説明】
第1図は本発明を適用した音声分析合成装置の全体構成
図、第2図は音声信号分析回路の詳細図、第3図は音声
信号分析回路の動作を説明するための信号波形図、第4
図は音声「Sa」の音声波形と、この音声の全周波数帯
域における電力情報を示す図、第5図は音声「Sa」の
音声波形と、音声「Sa」の前部にある摩擦音部の周波
数−音圧特性を示す図、第6図は一般的な音声と暗騒音
が有する周波数帯域と音圧の範囲を示す図、第7図は音
声「Sa」の音声波形と、この音声「Sa」の周波数帯
域を複数の周波数帯域に分けた場合の各周波数帯域の電
力情報を示す図である。 1……処理制御回路、2……制御用メモリ回路、 3……データ伝送回路、4……分析合成制御回路、 5……音声復号化回路、6……音声符号化回路、 7……音声信号分析回路、8……D/A変換回路、 9……A/D変換回路、10……音声データメモリ回
路、71〜74……電力情報演算部、701……バンド
パスフィルタ(BPF)、702……パワー演算部、7
03……パワーレジスタ、 704……比較器、705……スレツシユホルドレジス
タ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】人間等の発声した原音声信号を所定のサン
    プリング周期により取込み、量子化するA/D変換回路
    と、該A/D変換回路の出力信号を所定の符号化方式に
    より符号化する符号化回路と、符号化された音声データ
    を格納する音声データメモリ回路と、前記A/D変換回
    路の出力信号から原音声信号の電力情報を算出する音声
    信号分析回路と、音声データメモリ回路内の音声データ
    を用い、音声分析状態の確認あるいは所定の合成音声の
    音声再生を行う音声復号化回路と、該音声復号化回路の
    出力をアナログ出力として出力するD/A変換回路と、
    前記各機能回路を制御し、音声の分析、合成の処理を制
    御する音声分析合成制御回路とを備えた音声分析合成制
    御装置において、原音声信号から音声合成用の音声デー
    タを作成する際、前記音声分析回路は、前記A/D変換
    回路の出力信号を前記符号化回路と並列に受けて原音声
    信号を複数の周波数帯域に分け、各周波数帯域毎に電力
    情報を算出し、この各周波数帯域毎の電力情報と各周波
    数帯域毎に予め定められた高い周波数の周波数帯域で他
    の帯域より低いレベルを有するスレッシュホールドレベ
    ルとを比較することにより、音声信号の存在を検出して
    出力し、前記音声分析合成制御回路は、この音声分析回
    路の出力により原音声信号より有効な音声データ部分を
    切出すことを特徴とする音声分析方式。
JP61260586A 1986-11-04 1986-11-04 音声分析方式 Expired - Lifetime JPH0652479B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61260586A JPH0652479B2 (ja) 1986-11-04 1986-11-04 音声分析方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61260586A JPH0652479B2 (ja) 1986-11-04 1986-11-04 音声分析方式

Publications (2)

Publication Number Publication Date
JPS63115200A JPS63115200A (ja) 1988-05-19
JPH0652479B2 true JPH0652479B2 (ja) 1994-07-06

Family

ID=17350001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61260586A Expired - Lifetime JPH0652479B2 (ja) 1986-11-04 1986-11-04 音声分析方式

Country Status (1)

Country Link
JP (1) JPH0652479B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03132700A (ja) * 1989-10-18 1991-06-06 Victor Co Of Japan Ltd 音声の適応直交変換符号化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5774796A (en) * 1980-10-28 1982-05-11 Citizen Watch Co Ltd Voice recorder
JPS57161799A (en) * 1981-03-30 1982-10-05 Toshiyuki Sakai Voice information filter

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5774796A (en) * 1980-10-28 1982-05-11 Citizen Watch Co Ltd Voice recorder
JPS57161799A (en) * 1981-03-30 1982-10-05 Toshiyuki Sakai Voice information filter

Also Published As

Publication number Publication date
JPS63115200A (ja) 1988-05-19

Similar Documents

Publication Publication Date Title
US5031113A (en) Text-processing system
EP0077194B1 (en) Speech recognition system
KR20000022351A (ko) 음성 구간 검출 방법과 시스템 및 그 음성 구간 검출 방법과 시스템을 이용한 음성 속도 변환 방법과 시스템
JP3033061B2 (ja) 音声雑音分離装置
WO1990011593A1 (en) Method and apparatus for speech analysis
JPS62115199A (ja) 音声応答装置
US6704671B1 (en) System and method of identifying the onset of a sonic event
JP2002236494A (ja) 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPH0652479B2 (ja) 音声分析方式
JPS6367197B2 (ja)
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH03114100A (ja) 音声区間検出装置
JPH10133678A (ja) 音声再生装置
JP2557497B2 (ja) 男女声の識別方法
JPS5914769B2 (ja) 音声機器
JP2602641B2 (ja) 音声符号化方式
JP2891259B2 (ja) 音声区間検出装置
JPS61292199A (ja) 音声認識装置
JPS62238599A (ja) 音声区間検出方法
JPH0567039B2 (ja)
JP2555029B2 (ja) 音声認識装置
JPH02272495A (ja) 音声認識装置
JPH0343639B2 (ja)