JPS62164100A - 声帯特徴抽出装置 - Google Patents

声帯特徴抽出装置

Info

Publication number
JPS62164100A
JPS62164100A JP61006809A JP680986A JPS62164100A JP S62164100 A JPS62164100 A JP S62164100A JP 61006809 A JP61006809 A JP 61006809A JP 680986 A JP680986 A JP 680986A JP S62164100 A JPS62164100 A JP S62164100A
Authority
JP
Japan
Prior art keywords
histogram
residual waveform
vocal
vocal cord
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61006809A
Other languages
English (en)
Inventor
晋太 木村
小林 敦仁
達郎 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61006809A priority Critical patent/JPS62164100A/ja
Publication of JPS62164100A publication Critical patent/JPS62164100A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 本発明は、声帯波形の特徴を抽出する声帯特徴抽出装置
において、音声信号の線形予測分析を行って求めたLP
G係数と当該音声信号とに基づいて求めた残差波形の時
間方向の正規化したヒストグラムを声帯の特徴量として
出力することにより、声帯波の位相情報を出力してより
正確な声帯特徴を抽出し得るようにしている。
〔産業上の利用分野〕
本発明は、声帯の運動の位相情報を出力する音声特徴抽
出装置に関するものである。
〔従来の技術〕
従来の音声特徴抽出装置の構成として第6図に示すよう
なものがあった。この装置は、マイクロホン1によって
電気信号に変換した音声信号をA/D変換部2に入力し
てデジタル信号に変換する。
このデジタル信号に変換された音声信号は、LPC分析
部(線形予測分析部)3に入力され、LPC係数が求め
られる。この求められたLPG係数およびデジタル変換
された音声信号に基づいて、残差波形演算部4は残差波
形を求める。この求めた残差波形は、スペクトル分析部
20によってパワースペクトルが計算され、声帯特徴と
して出力されていた。
〔発明が解決しようとする問題点〕
従来の音声特徴抽出装置は、既述したように、LPG係
数と音声信号とに基づいて残差波形を求め、この求めた
残差波形のパワースペクトルを声帯特徴として出力して
いたため、残差波形(推定声帯波)は異なっているが、
当該残差波形のパワースペクトルが極めて類似してしま
う場合が生じ、両者の声帯波を区別し得ないという問題
点があった。例えば第3図図示声帯波Aのように立ち上
がりが緩やかで立ち下がりが急なものと、声帯波Cのよ
うに立ち上がりが急で立ち下がりが緩やかなものとに対
して夫々求めた残差波形は、第4図図示残差波形Aおよ
び残差波形Cのように極性が異なるものとなる。このた
め両者のパワースペクトルを算出すると、極めて類似し
たものとなり、両者を区別し得ないという問題点があっ
た。
c問題点を解決するための手段〕 本発明は、前記問題点を解決するために、音声信号の線
形予測分析を行って求めたLPG係数と音声信号とに基
づいて残差波形を求め、次いでこの残差波形の時間方向
の正規化したヒストグラムを求めて声帯の特@、量とし
て出力する構成を採用することにより、声帯波の位相情
報を出力してより正確な声帯特徴を抽出するようにして
いる。
第1図に示す本発明の1実施例構成を用いて問題点を解
決するための手段を説明する。
第1図において、マイクロホン1は、話者の音声を電気
信号に変換するものである。
A/Di換器2は、マイクロホン1によって電気信号に
変換された音声信号を、デジタルの音声信号に変換する
ものである。
LPG分析部(線形予測分析部)3は、デジタルの音声
信号からLPG係数を演算して求めるものである。
残差波形演算部4は、LPC分析分析部上って求めたL
PG係数とデジタルの音声信号とに基づいて残差波形を
演算して求めるものである。
ヒストグラム演算部5は、残差波形演算部4によって求
めた残差波形から時間方向のヒストグラムを演算して求
めるものである。
ヒストグラム正規化部6は、ヒストグラム演算部5によ
って求めた残差波形のヒストグラムを、残差波形の最大
振幅値(波高値)で正規化を行うものである。この正規
化された残差波形のヒストグラムは、声帯特徴信号とし
て出力される。
〔作用〕
第1図を用いて説明した構成を採用し、話者がマイクロ
ホン1に向かって音声を発声すると、マイクロホン1お
よびA/D変換部2によってデジタル信号に変換された
音声信号は、LPG分析部3に人力され、LPG係数が
算出される。この算出されたLPG係数とデジタル変換
された音声信号とが、残差波形演算部4に入力され、残
差波形が演算される。この演算された残差波形は、ヒス
トグラム演算部5に人力され、時間方向の残差波形のヒ
ストグラムが算出される。この算出された残差波形のヒ
ストグラムが、ヒストグラム正規化部6に入力され、残
差波形の最大振幅値によって正規化される。この正規化
された残差波形のヒストグラムは、声帯特徴信号として
出力される。
以上説明したように、残差波形の時間方向の正規化され
たヒストグラムを生成する構成を採用することにより、
声帯波の位相情報を持つ声帯特徴信号を出力してより正
確な声帯特徴を抽出することが可能となる。
〔実施例〕
第2図ないし第5図を用いて第1図図示本発明の1実施
例構成および動作を詳細に説明する。
第2図図示声帯波推定のモデルにおいて、声帯7が振動
して発生した声帯波は声道8という一種の共鳴管を通っ
て音声として送出され、マイクロホン1によって電気信
号に変換される。この電気信号に変換され、デジタル信
号に変換された音声信号は、LPG分析部3 (および
残差波形演算部4)によって残差波形(推定声帯波)が
生成される。具体的に説明すると、発話者A、Bおよび
Cの声帯波を例えば第3図図示声帯波A、BおよびCと
すると、夫々の残差波形(推定声帯波)は、第4図図示
残差波形A、BおよびCのようなものになる。この残差
波形A、BおよびCは、声帯波A、BおよびCの高域成
分のみを夫々抽出、即ち微分した態様のものとなる。従
って、声帯波A(C)が、徐々に(急に)立ち上がり、
急に(徐々に)立ち下がる波形であるため、残差波形A
 (C)は、負(正)の極性をもつ波形(第4図図示A
(C))となる。声帯波Bは、徐々に立ち上がり、徐々
に立ち下がる波形であるため、残差波形Bは、正および
負の極性をもつ緩やかな波形(第4図図示B)となる。
次いで、本実施例では、残差波形に対して位相情報を抽
出するために、ヒストグラム演算部5およびヒストグラ
ム正規化部6が当該残差波形の時間方向の正規化したヒ
ストグラムを生成する。例えば第5図図中残差波形Aお
よび残差波形C(第4図図示残差波形AおよびC)に対
して夫々図中Talおよび(blを用いて示す時間方向
の正規化したヒストグラムを生成する。この正規化され
た残差波形のヒストグラムA(図示(a))は、負の方
向にかたよっており、一方、残差波形のヒストグラムB
(図示(b))は正の方向にかたよっている。このため
、残差波形のパワースペクトルでは分離した態様で抽出
し得ないものが、当該残差波形のヒストグラムでは、両
者の位相情報を分離した態様で抽出することが可能とな
る。この抽出3〆た位相情報は、声帯特徴信号として出
力される。
〔発明の効果〕
以上説明したように、本発明によれば、音声信号の線形
予測分析を行って求めたLPG係数と音声信号とに基づ
いて残差波形を求め、次いでこの残差波形の時間方向の
正規化したヒストグラムを求めて声帯の特徴量として出
力する構成を採用しているため、声帯波の位相情報を抽
出した態様で出力した声帯特徴信号を用いて、より正確
な声帯特徴を抽出することができる。このため、当該抽
出した声帯特徴信号を用いた精度の高い話者同定装置や
話者識別装置を提供することができろ。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2FI21は声帯
波推定モデル、第3図は声帯波例、第4図は残差波形例
、第5図は残差波形のヒストグラム例、第6図は従来の
装置の構成を示す。 図中、1はマイクロホン、2はA/D変換部、3はLP
G分析部、4は残差波形演算部、5はヒストグラム演算
部、6はヒストグラム正規化部を表わす。

Claims (1)

  1. 【特許請求の範囲】 声帯波形の特徴を抽出する声帯特徴抽出装置において、 音声波を電気信号に変換するマイクロホン(1)と、こ
    のマイクロホン(1)によって電気信号に変換された音
    声信号をデジタルの音声信号に変換するA/D変換部(
    2)と、 このA/D変換部(2)によって変換された音声信号の
    線形予測分析を行ってLPC係数を求める線形予測分析
    部(3)と、 この線形予測分析部(3)によって求められたLPC係
    数とデジタルの音声信号とに基づいて残差波形を求める
    残差波形演算部(4)と、 この残差波形演算部(4)によって求められた残差波形
    の時間方向のヒストグラムを求めるヒストグラム演算部
    (5)と、 このヒストグラム演算部(5)によって求められたヒス
    トグラムの正規化を行うヒストグラム正規化部(6)と
    を備え、 この正規化されたヒストグラムを声帯の特徴量として出
    力するよう構成したことを特徴とする声帯特徴抽出装置
JP61006809A 1986-01-16 1986-01-16 声帯特徴抽出装置 Pending JPS62164100A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61006809A JPS62164100A (ja) 1986-01-16 1986-01-16 声帯特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61006809A JPS62164100A (ja) 1986-01-16 1986-01-16 声帯特徴抽出装置

Publications (1)

Publication Number Publication Date
JPS62164100A true JPS62164100A (ja) 1987-07-20

Family

ID=11648521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61006809A Pending JPS62164100A (ja) 1986-01-16 1986-01-16 声帯特徴抽出装置

Country Status (1)

Country Link
JP (1) JPS62164100A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH043100A (ja) * 1990-04-19 1992-01-08 Oki Electric Ind Co Ltd スペクトル分析方法及びその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH043100A (ja) * 1990-04-19 1992-01-08 Oki Electric Ind Co Ltd スペクトル分析方法及びその装置

Similar Documents

Publication Publication Date Title
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
CN108461081B (zh) 语音控制的方法、装置、设备和存储介质
JPS5844500A (ja) 音声認識方式
CN111107284A (zh) 一种视频字幕实时生成系统及生成方法
JPS62164100A (ja) 声帯特徴抽出装置
JP2992324B2 (ja) 音声区間検出方法
Miller et al. Investigation of the glottal waveshape by automatic inverse filtering
JP3035939B2 (ja) 音声分析合成装置
JP3145955B2 (ja) 音声波形処理装置
KR100381372B1 (ko) 음성특징 추출장치
JPH024920B2 (ja)
JP4007628B2 (ja) 音声ピッチの周期の正規化を行う音声合成装置
JP4882152B2 (ja) 話速検出方法および音声信号処理装置
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPH0461359B2 (ja)
JPS58190998A (ja) 音声認識装置
JPS61190400A (ja) 発声速度推定装置
CN117935848A (zh) 一种智能多维音频分析与合成系统
JPS60189800A (ja) 音声分析装置
JPS62115498A (ja) 無声破裂子音識別方式
JPS58147797A (ja) 音声認識装置
JPS62141600A (ja) 音声合成装置
JPH0670753B2 (ja) 極零分析装置
JPS6243697A (ja) 音声分析装置
JPS63210900A (ja) 音声合成装置